邮件服务器故障排除典型案例

运维 服务器运维
邮件服务器A和邮件服务器B,作前后端设置,前端接收邮件后,投递给后端服务器内的邮箱,当前前端接收外部邮件后,无法投递给后端邮箱,导致邮件积压在前端服务器,内部邮件传递需要延迟25分钟左右到达。这是怎么回事呢?

邮件服务器故障症状描述:

邮件服务器A和邮件服务器B,作前后端设置,前端接收邮件后,投递给后端服务器内的邮箱,当前前端接收外部邮件后,无法投递给后端邮箱,导致邮件积压在前端服务器,内部邮件传递需要延迟25分钟左右到达。
 
通过察看前后端服务器的各类服务,发现所有服务均正常,由于无法投递给后端服务器,所以首先判断可能是后端服务器出现了问题,决定重启动。
 
重启动耗时4分钟,这时候察看前端队列,发现已经正常投递给后端服务器,认为问题解决,可能是意外原因导致后端服务器服务不正常。
 
但是经过5分钟的观察,发现,问题仍然存在,外部投递邮件仍然积压在前端服务器上,于是又深层次查找问题,发现如下症状
在Message Submitted to Advanced Queuing 和 Started Message Submission to Advanced Queue两步用时超过10分钟,在Message Submitted to Categorizer 和Message Categorized and Queued for Routing 之间历时接近10分钟,根据这个线索,查找资料,得到如下类似症状
 
http://www.microsoft.com/technet/prodtechnol/exchange/ZH-CN/Guides/E2k3TransnRouting/18682a71-ba92-42ec-9a54-8514d607c522.mspx?mfr=true

 
由于全局编录服务器问题而导致邮件传递出现延迟
全局编录问题可能导致邮件传递出现延迟。在这种情况下,会生成 NDR 以通知发件人这一延迟。可以使用邮件跟踪中心来诊断这些问题。下面的示例显示了从邮件跟踪中心所收集到的数据:
6/22/2001 3:54 PM Tracked message history on server CONTOSO-MSG-01
6/22/2001 3:54 PM SMTP Store Driver: Message Submitted from Store
6/22/2001 3:54 PM SMTP: Message Submitted to Advanced Queuing
6/22/2001 3:54 PM SMTP: Started Message Submission to Advanced Queue
6/22/2001 3:54 PM SMTP: Message Submitted to Categorizer
6/22/2001 4:24 PM SMTP: Started Outbound Transfer of Message
6/22/2001 4:24 PM Message transferred out to FOURTHCOFFEE.COM through SMTP
6/22/2001 4:24 PM SMTP: Message Submitted to Advanced Queuing
6/22/2001 4:24 PM SMTP: Started Message Submission to Advanced Queue
6/22/2001 4:24 PM SMTP: Message Submitted to Categorizer
6/22/2001 4:24 PM SMTP: Started Outbound Transfer of Message
6/22/2001 4:24 PM Message transferred out to FOURTHCOFFEE.COM through SMTP
6/22/2001 4:24 PM SMTP Store Driver: Message Delivered Locally to Store
在上面的示例中,应注意到邮件在邮件分类程序中延迟了 30 分钟,之后才开始进行出站传输,并且最终被送达。在这些情况下,应通过运行 Nltest 工具来确定 Exchange 使用哪一台全局编录服务器。具体步骤在本主题前面的“通过使用移动邮箱工具将收件人移到 Active Directory”中已说明。然后,调查所涉及到的全局编录服务器。下面是全局编录服务器的常见问题:
• 全局编录服务器超载或工作过度。
• 全局编录服务器出现性能问题。
• 内存不足。
• 硬盘空间不足。
• Exchange 2000 与全局编录服务器之间出现暂时性的网络问题。
• 使用同一个全局编录服务器的 Exchange 服务器过多(推荐的 Exchange 处理器与全局编录服务器处理器的比率是四比一)。

要点:

邮件跟踪日志可能会起到一种误导作用。例如,如果全局编录服务器正常工作,并且邮件分类程序也正常工作,但是远程 SMTP 服务器不可用达三十分钟,则邮件跟踪日志可能与上面显示的示例日志类似。此外,如果邮件必须在本地传递,并且 Exchange 存储执行速度很慢,则邮件跟踪日志将显示出“邮件已提交到邮件分类程序”与“邮件已传递到本地存储”之间存在很大的时间差异。
重现问题时,应从全局编录服务器中使用系统监视器日志。这有助于您诊断这些问题。再次使用全局编录服务器可以解决这些问题。要解决这些问题,可以为每一台 Exchange 服务器指定一台全局编录服务器。 

注意:

建议只有在要排除故障时才手动配置全局编录服务器。手动配置了全局编录服务器后,如果某个服务器不可用,Exchange 将无法检测到。
有关详细信息,请参阅如何指定全局编录服务器。
有关 DSAccess 的其他信息,请参阅 Microsoft 知识库中编号为 250570 的文章:“XCON: Directory Service Server Detection and DSAccess Usage”。
ExchOwningPFTreeBL: CN=Public Information Store (PFREP55),CN=First Storage Group,CN=InformationStore,CN=PFREP55,CN=Servers,CN=FourthCoffee,CN=Administrative Groups,CN=Lake District,CN=Microsoft Exchange,CN=Services,CN=Configuration, DC= cumbria,DC=extest,DC=microsoft, DC=com;
CN=Public Folder Store (PFREP57),CN=First Storage Group,CN=InformationStore, CN=PFREP57,CN=Servers,CN=Coniston,CN=Administrative Groups,CN=Lake District,CN=Microsoft Exchange,CN=Services,CN=Configuration,DC=cumbria,DC=example,DC=microsoft,DC=com;
CN=Public Information Store (PFREP56),CN=First Storage Group,CN=InformationStore,CN=PFREP56,CN=Servers,CN=Coniston,CN=Administrative Groups,CN=Lake District,CN=Microsoft Exchange,CN=Services,CN=Configuration,DC=cumbria,DC=example,DC=microsoft,DC=com;


紫色字部分症状与我们的症状是一样的,所以,根据此结果,我们查询了两台邮件服务器获取账户的GC,通过命令
NLTEST /DSGETDC:suzsoft.com /GC
得到如下信息:
NLTEST /DSGETDC:suzsoft.com /GC
           DC: \\w2kdc1.suzsoft.com
      Address: \\10.0.15.11
     Dom Guid: f4938c04-de3e-4db1-bbd6-b8a65eaeb77e
     Dom Name: suzsoft.com
  Forest Name: suzsoft.com
 Dc Site Name: Default
Our Site Name: Default
        Flags: PDC GC DS LDAP KDC TIMESERV GTIMESERV WRITABLE DNS_DC DNS_DOMAIN
DNS_FOREST CLOSE_SITE
The command completed successfully
 
 
NLTEST /DSGETDC:suzsoft.com /GC
DC: \\w2kdc2.suzsoft.com
Address: \\10.0.15.12
Dom Guid: f4938c04-de3e-4db1-tt58-b8a666dwb07e
Dom Name: suzsoft.com
Forest Name: suzsoft.com
Dc Site Name: Default
Our Site Name: Default
Flags: PDC GC DS LDAP KDC TIMESERV GTIMESERV WRITABLE DNS_DC DNS_DOMAIN
DNS_FOREST CLOSE_SITE
The command completed successfully

可以看出,两台服务器引用的GC是不同的,由于以前没有出现该问题,那么我们猜测,是否由于两台GC同步上出了问题,导致GC数据不同步,邮件服务器引用数据无法匹配,导致邮件无法传递,因此,我们做了如下操作:
 
修正邮件服务器的缺省引用GC,保证两邮件服务器引用同一台GC的数据,重启动生效后,问题解决。
 
总结:
 
由于EXCHANGE 服务器与域结合非常紧密,所以,当邮件服务器出现问题后,有可能是域控制器的问题导致。
 
附一:如何指定全局编录服务器
 
http://www.microsoft.com/technet/prodtechnol/exchange/ZH-CN/Guides/E2k3TransnRouting/411e8bfd-6291-4bd0-bfd5-dad94220062e.mspx?mfr=true
 
全局编录问题可能导致邮件传递出现延迟。在这种情况下,会生成 NDR 以通知发件人这一延迟。可以使用邮件跟踪中心来诊断这些问题。
下面是全局编录服务器的常见问题:
• 全局编录服务器超载或工作过度。
• 全局编录服务器出现性能问题。
• 内存不足。
• 硬盘空间不足。
• Exchange 2000 Server 与全局编录服务器之间出现暂时性的网络问题。
• 使用同一个全局编录服务器的 Exchange 服务器过多(推荐的 Exchange 处理器与全局编录服务器处理器的比率是四比一)。

 要点:

邮件跟踪日志可能会起到一种误导作用。例如,如果全局编录服务器正常工作,并且邮件分类程序也正常工作,但是远程 SMTP 服务器不可用达三十分钟,则邮件跟踪日志可能与上面显示的示例日志类似。此外,如果邮件必须在本地传递,并且 Exchange 存储执行速度很慢,则邮件跟踪日志将显示出“邮件已提交到邮件分类程序”与“邮件已传递到本地存储”之间存在很大的时间差异。
重现问题时,应从全局编录服务器中使用系统监视器日志。这有助于您诊断这些问题。再次使用全局编录服务器可以解决这些问题。要解决这些问题,可以对每一台 Exchange 服务器指定一台全局编录服务器。
  注意:
建议只有在要排除故障时才手动配置全局编录服务器。手动配置了全局编录服务器后,如果某个服务器不可用,Exchange 将无法检测到。
开始之前
在执行本主题中的步骤之前,请阅读未送达报告邮件故障排除。
执行此步骤需要有下列权限:
• 本地管理员组的成员,以及在组织级别应用了 Exchange 管理员角色的组的成员 

步骤
指定全局编录服务器
1. 在 Exchange 系统管理器中,展开“服务器”,用鼠标右键单击您的 Exchange 服务器,再单击“属性”。
2. 单击“目录访问”选项卡。
3. 在“显示”中,选择“全局编录服务器”。
4. 清除“自动探查服务器”复选框。
“目录访问”选项卡
5. 单击“添加”,再选择要排除其故障的全局编录服务器。所选定的用作域的全局编录服务器的服务器必须存在于 Active Directory 中、必须可以通过 LDAP 端口 3268 访问到、必须实时地处理 Exchange 服务器的请求,并且必须具有收件人对象的全部已启用邮件属性。

下面的示例显示了从邮件跟踪中心所收集到的数据:
6/22/2001 3:54 PM Tracked message history on server CONTOSO-MSG-01
6/22/2001 3:54 PM SMTP Store Driver: Message Submitted from Store
6/22/2001 3:54 PM SMTP: Message Submitted to Advanced Queuing
6/22/2001 3:54 PM SMTP: Started Message Submission to Advanced Queue
6/22/2001 3:54 PM SMTP: Message Submitted to Categorizer
6/22/2001 4:24 PM SMTP: Started Outbound Transfer of Message
6/22/2001 4:24 PM Message transferred out to FOURTHCOFFEE.COM through SMTP
6/22/2001 4:24 PM SMTP: Message Submitted to Advanced Queuing
6/22/2001 4:24 PM SMTP: Started Message Submission to Advanced Queue
6/22/2001 4:24 PM SMTP: Message Submitted to Categorizer
6/22/2001 4:24 PM SMTP: Started Outbound Transfer of Message
6/22/2001 4:24 PM Message transferred out to FOURTHCOFFEE.COM through SMTP
6/22/2001 4:24 PM SMTP Store Driver: Message Delivered Locally to Store
在上面的示例中,应注意到邮件在邮件分类程序中延迟了 30 分钟,之后才开始进行出站传输,并且最终被送达。在这些情况下,应通过运行 Nltest 工具来确定 Exchange 使用哪一台全局编录服务器。具体步骤在产生未送达报告的常见情形中的“通过使用移动邮箱工具将收件人移到 Active Directory”部分已说明。然后,调查所涉及到的全局编录服务器。
有关 DSAccess 的其他信息,请参阅 Microsoft 知识库中编号为 250570 的文章:“XCON: Directory Service Server Detection and DSAccess Usage”(英文)。

责任编辑:桑丘 来源: 网络博客
相关推荐

2009-09-08 15:41:08

NFS服务器

2010-04-19 17:18:14

2009-09-17 18:09:53

Nis服务器

2009-10-21 14:39:27

HP服务器故障排除

2009-10-21 14:16:50

服务器故障排除

2009-12-04 09:47:47

LinuxNFS服务器

2011-05-25 10:52:45

2009-07-16 15:27:59

web服务器

2009-10-13 10:55:14

Web服务器故障排除

2009-08-26 11:55:55

Dell服务器故障排除

2009-06-27 20:20:00

LinuxNFS故障

2009-08-24 17:20:29

IBM刀片服务器宕机

2009-08-14 17:34:02

2009-04-22 17:03:40

Linux服务器七要素

2010-08-31 22:27:11

DHCP服务器

2009-09-02 17:41:49

邮件服务器

2009-10-22 13:16:56

邮件服务器故障检查

2010-12-30 11:20:13

数据库连接

2011-08-10 10:39:47

路由器路由器故障

2011-11-15 22:13:48

服务器死机故障排除
点赞
收藏

51CTO技术栈公众号