GoldenGate的常见错误分析 - 面向对象网,数据库,oracle,学习,对象 - 面向对象技术开发

面向对象技术开发

会员投稿 投稿指南 站长资讯通告:
您的位置: 首页 > 数据库 > ORACLE > 正文

GoldenGate的常见错误分析

来源: www.bianceng.cn 阅读:

(1)解决GoldenGate错误的一个关键点就是通过错误分析工具(包括report文件,ggserr.log discard文件logdump工具,GGSCI命令行)确定错误的根源是哪个组件引起的。

系统或者网络?

数据库报错或者应用报错?

GoldenGate安装报错?

GoldenGate的某个进程报错?

GoldenGate的参数配置文件报错?

SQL语句或者存储过程报错?

然后再确定错误的原因,逐个排查。

(2)当GoldenGate遇到错误时,则可以借助日志、report文件找到错误原因,一步一步来排查。一般的错误信息GoldenGate都会提示有相应的解决办法。

如下介绍一个错误案例:

通过命令:

示例14:

GGSCI>view ggsevt

看到的报错信息如图4所示。

\

图4

通过view report dpeyb 看到的也是类似的信息。

再来观察容灾端复制进程的报错信息为:

示例15:

2011-03-02 12:03:37  ERROR   OGG-01028  Incompatible record in ./dirdat/yb018262, rba 72955479 (getting header)。

通过logdump进入到该trail文件查看,如图5所示。

\

图5

通过分析推敲等,确认是因为trail文件有一条记录已损坏,导致投递进程不识别,不能自动翻滚到下一个trail文件,而复制进程也不能自动应用到下一个trail文件,Pump进程通过手动etrollover,复制进程通过alter手动指定到下一个trail文件应用,故障即可排除。

1、AIX GGSCI无法运行

错误信息:

示例16:

Cannot load ICU resource bundle 'ggMessage', error code 2 - No such file or directory

Cannot load ICU resource bundle 'ggMessage', error code 2 - No such file or directory

IOT/Abort trap (core dumped)

或者GGSCI可以启动,但是运行任何命令都报上面的错误。

处理方法:通常使用已有的mount点安装GoldenGate,在mount时使用了并发CIO参数。新建文件系统,重新mount,作为GoldenGate安装目录。

错误信息:

示例17:

$ ./ggsci

exec(): 050036 Cannot load program GGSCI because of the following errors:

050130 Symbol resolution failed for GGSCI because:

050136   Symbol _GetCatName__FiPCc (number 158) is not exported          from dependent module /usr/lib/libC.a[ansi_64.o].

050136   Symbol _Getnumpunct__FPCc (number 162) is not exported          from dependent module /usr/lib/libC.a[ansi_64.o].

050136   Symbol __ct__Q2_3std8_LocinfoFPCci (number 183) is not          exported from dependent module /usr/lib/libC.a[ansi_64.o].

050192 Examine .loader section symbols with the 'dump -Tv' command.

原因是XLC是6.0版本,升级XLC版本到10.1以上,问题即可解决。

2、HP-UX GGSCI无法运行

错误信息:core dumped

该问题只在HP-UX11.31上发现。

处理方法:环境变量没有设置正确。

3、OGG-01296

示例18:

ERROR   OGG-01296  Oracle GoldenGate Delivery for Oracle, yx_rep3.prm:  Error mapping from SGPM.A_PAY_FLOW to SGPM.A_PAY_FLOW.

由于源端进行了表结构更改,没有通知目标端,导致此错误。

处理方法:在目标端执行相应的语句,将表结构修改为和源端一致。

4、OGG-01088

错误信息:

示例19:

ERROR   OGG-01088  Oracle GoldenGate Delivery for Oracle, pms_rep1.prm:  malloc 2097152 bytes failed.

ERROR   OGG-01668  Oracle GoldenGate Delivery for Oracle, pms_rep1.prm:  PROCESS ABENDING.

处理方法:

(1)“ulimit –a”,验证操作系统对用户是否所有资源都是无限制。

(2)将进程进行拆分,拆分为多个进程。

(3)从support.oracle.com下载最新的补丁包,升级GoldenGate。

5、OGG-01224

示例20:

ERROR OGG-01224 Oracle GoldenGate Manager for Oracle, mgr.prm: No buffer space available

处理方法:

修改mgr.prm,扩大动态端口范围,dynamicportlist 7840-7914。

6、OGG-01031

示例21:

ERROR   OGG-01031  There is a problem in network communication, a remote file problem, encryption keys for target and source do not match (if using ENCRYPT) or an unknown error. (Reply received is Expected 4 bytes, but got 0 bytes, in trail ./dirdat/t1000026, seqno 26, reading record trailer token at RBA 103637218)。

2011-01-06 11:04:16  ERROR   OGG-01668  PROCESS ABENDING.

处理方法:

可能是目标端的trail file出问题了,前滚重新生成一个新的SEND EXTRACT xxx ROLLOVER,或者“alter extract xxx rollover”。

7、OGG-01072

示例22:

ERROR OGG-01072 LOBROW_get_next_chunk(LOBROW_row_t *, BOOL, BOOL, BOOL, LOBROW_chunk_header_t *, char *, size_t, BOOL, *) Buffer overflow, needed:132, alloc

处理方法:

(1)如果版本为11.1.1.0.1 Build 078版本,升级到最新的补丁包。

(2)使用“ulimit –a”查看资源使用限制,调整资源为unlimited。

(3)Extract: DBOPTIONS LOBBUFSIZE 。

(4)replicat: DBOPTIONS LOBWRITESIZE 1MB。

8、OGG-01476

示例23:

ERROR   OGG-01476  The previous run abended due to an out of order transaction. Issue ALTER ETROLLOVER to advance the output trail sequence past the current trail sequence number, then restart. Then, use ALTER EXTSEQNO on the subsequent pump EXTRACT, or REPLICAT, process group to start reading from the new trail file created by ALTER ETROLLOVER; the downstream process will not automatically switch to the new trail file.

查看本栏目更多精彩内容:http://www.bianceng.cn/database/Oracle/

Tags:
相关文章列表: