10个方法处理基于SIP的voip语音环境问题

简介: 在VoIP的环境中,特别是基于SIP通信的环境中,我们经常会遇到一些非常常见的问题,例如,单通,30秒就断线,注册问题,回声等。

这些问题事实上都有非常直接的排查方式和解决办法,用户可以按照一定的排查方式,工具非常高效地解决这些问题。但是,因为读者技术水平参差不齐,网络上的很多技术也不完整。笔者今天系统归纳了这些问题。根据一些用户的使用环境和用户经常遇到一些问题,我们列举了以下十个在SIP呼叫中经常遇到的问题,并且给出了相应的排查方式,用户可以按照这些方法来解决SIP通话中的这些问题。这十个经典的问题包括:

不能注册或呼叫到SIP服务器端

30秒挂断呼叫的黄金法则

咬线或摘机状态

单通或无语音

收到400 bad request

收到413,513 Request Entity Too Large或Message Too Large消息

收到408, 480或者487 消息

483 - Too Many Hops

488 – Not Acceptable Here

语音质量和思科语音文件示例分享


这里,读者一定要注意,我们这里仅讨论关于SIP环境中的常见问题,可能涉及网络环境或者硬件终端的问题,因为很多厂家和SIP服务器的配置不同,可能存在一定的差异,所以用户在我们的方法中特别需要根据厂家的不同,增加一些专门针对每个厂家或者SIP服务器的排查方式。我们仅讨论一般情况下的排查方式。


一、在一般的SIP 环境中,通常来说,SIP终端需要注册到SIP服务器端来实现认证,服务器端获得SIP终端的位置,然后才能进行正常的呼叫流程。注册问题可能有以下几种呈现方式:不能注册,完全没有和SIP服务器连接。如果终端发送注册消息给服务器端时,双方完全可能完全没有实现通讯。用户需要在服务器端通过日志排查方式,检查SIP终端是否有注册消息进入到服务器端,或者SIP终端通过网络工具对服务器端进行排查,例如使用Ping 命令。如果连Ping命令都检测不到服务器地址,基本上可以断定SIP终端根本没有和服务器端连接。关于服务器端排查方式很多,最典型的就是使用的Asterisk,FreeSWITCH,OpenSIPS或者Kamailio等开源的软交换平台。每个平台都有各自的排查命令,用户可以参考官方手册来判断。当然,用户也可以使用linux排查工具对5060端口抓包排查(例如,sngrep)。本人非常推荐这个工具,非常好用,可以实时检查SIP消息。

      SIP终端发出了注册消息,但是SIP服务器端没有返回的消息。如果SIP终端对SIP服务器端发送了注册消息,但是服务器端没有返回响应消息,则可能是服务器端的问题。用户需要排查服务器端为什么没有返回消息,或者在返回路径上的节点是否出现了问题。客户端收到错误消息,收到太多401/407 Unauthorized。SIP终端在注册时,如果用户的安全设置出现了错误,可能导致服务器端发送多个 401 错误。服务器端第一次发送到是正常的401验证信息,如果连续多次发送401/407 错误的话,可能是SIP终端输入了错误的用户账号信息,SIP终端侧需要配合服务器端进行排查,也可能服务器端的SIP账号消息保存错误,或者没有重新加载服务器相应模块,用户最好通过服务器端的CLI命令来检查内存中的SIP终端的真实数据信息。

     客户端收到403 Forbidden 消息。如果用户帐户信息没有问题的话,SIP终端可能没有输入正确的From domain或者R-URI。有时,服务器端禁止同时注册几个SIP终端账号,或者注册过于频繁,服务器端可能过滤了此地址。需要用户配合服务器端地址进行进一步检查。这里,笔者仅讨论注册阶段出现的403 问题,当然也可能是系统防火墙或者其他的配置禁止了注册消息。如果是呼叫时出现403的话,则可能是另外的原因,例如可能欠费,可能呼叫了服务器端禁止的号码码位等其他因素。


二、我们经常会遇到客户抱怨这样的问题,电话通话时,在大概30秒左右就断线。这样的问题最主要的原因是SIP终端没有收到ACK消息。SIP终端发送了 200 OK以后就开始了媒体的创建,RTP语音流开始启动,事实上,SIP终端可能还没有收到ACK消息,因此在30秒左右,没有收到消息的一方就发送了一个BYE消息。那么,为什么我们没有收到ACK消息呢?具体的场景如下两种示例,返回时因为NAT问题导致ACK没有办法返回到相应的终端:

在很多应用场景中,用户可能遇到更为复杂的NAT环境,如果其中一个代理出现了NAT处理无效的结果,就可能导致整个SIP信令路径出现ACK丢失的问题。

一般情况下,缺少ACK消息的原因主要来自于以下几个方面:

Contact header 错误

客户端没有支持router header

网关在NAT后

Contact header 的地址在NAT后

以上几种情况都需要用户排查网络环境和NAT设置。因为NAT问题,ACK返回的路径地址发生了改变,所以SIP终端没有收到ACK消息。一些厂家的设备或者媒体服务器也有类似的设置,例如Lync 服务器,它支持了RTCP 呼叫活动检测功能,如果超过30秒的检测周期没有收到RTCP数据包,则会挂机。在开源Asterisk平台上,RTP的默认设置时间为30秒,一些SIP运营商可能会忽略UPDTAE消息,在SIP的设置中可以对其进行设置调整disallowed_methods=UPDATE 或SIP的会话定时器设置。


三、SIP终端不能挂机或者处于摘机状态是第三个经常遇到的问题。在SIP终端中的表现形式为终端没有发送BYE消息或者发送了错误的BYE消息内容。

没有发送BYE的状态:

其原因主要表现在:

  • 没有发送BYE消息
  • 发送到BYE消息携带了错误的to-tag
  • 发送了格式不规范的BYE消息,例如格式错误,sequences错误或者时间戳错误。
  • 发送的BYE消息中携带的是错误的路由信息

对于出现的这些问题,用户需要根据SIP消息来进行排查,对比哪些路径节点出现了问题。当然,这些问题带来的结果大家可能都非常清楚。首先,计费的准确性出现了问题,用户的计费不能完整准确地监控。另外,如果媒体服务器对呼叫有限制的话,因为其中一个SIP终端没有真正挂机,其他用户可能不能呼出的问题。如果是一台模拟网关的话,可能出现FXO或者FXS不能正常工作的问题。出现以上这些问题,读者还是要从终端的配置来解决问题,是否出现了终端的配置问题,终端的质量问题。如果是FXO或者FXS的话,是否出现了制式不匹配的问题导致咬线或者摘机的问题。

从服务器端处理的话,可以通过两种办法来通过服务器端对其进行强制挂机处理。这四种服务器端的检测方式是:

  • 开启RTP超时检测来检测终端的RTP流是否仍然活动
  • 开启SIP的KeepAlive 检测SIP 会话状态
  • 使用Proxy中的dialog中的OPTION来检测SIP终端响应状态,SIP终端发送 200 OK到proxy来检测终端的状态。

使用SIP session timer 定时器来进行周期检测,SIP终端一直在周期内刷新自己的状态。如果SIP终端来定时器的时间范围内,则表示终端参与活动状态;否则,则对其发送BYE消息,强行挂机。

关于session timer的规范,大家可以参考rfc4028,具体的定义方式如下:

完整的SIP sesison timer 流程图如下:

但是,因为很多SIP网络环境中介入了SBC或者其他的网络设备,很多情况下,有时定时器时间设置过短,SBC作为UAC或者UAS,或者proxy不刷新都可能出现上述问题。所以,会话的定时器的管理需要特别小心。


在SIP 语音呼叫中,一些用户也经常遇到单通的问题,简单来说,就是双方呼叫时,只能听到一方的语音。单通问题的主要原因来自于以下几个方面:

  • INVITE和200 OK中的SDP的地址不通。用户可以通过sngrep工具来检查SDP的地址是否可以ping 通。如果INVITE中的地址不能和200 OK中的SDP地址不能连通的话,可能导致单通的问题,有时也存在NAT问题,需要用户针对性地进行排查。
  • 网络防火墙过滤了UDP端口。如果以上两个地址相通的话,也有可能是网络的防火墙过滤了RTP端口。用户必须开启路由器的端口转发策略,媒体服务器的端口范围不同,可能rtp的端口设置不同。一般的例如Asterisk或者FreeSWITCH都是10000-20000的端口范围,也有一些服务器端口从其他的数值开始计算。
  • ALG 网关设置问题。ALG网关有时可以解决NAT问题,但是也同样会带来其他的问题。ALG可以设置其他的SIP 服务器端口。有时用户可以关闭路由器上的ALG选项解决单通问题。
相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
1天前
|
API UED 开发者
鸿蒙应用 VoIP 通话管理模块使用分享
最近老板突然提出需求,希望用户能在应用中发起语音或视频通话,并支持来电提醒、挂断、静音等功能。虽然任务复杂,但可以利用鸿蒙的voipCall模块实现这些需求。该模块提供VoIP通话管理功能,包括上报来电状态、管理通话状态及处理用户交互事件。通过导入`@kit.CallKit`并使用相关API,可以轻松实现语音和视频通话、来电提醒、静音、扬声器等操作。示例代码展示了如何处理来电和音频事件,确保用户获得流畅可靠的通话体验。希望这篇文章能帮大家避免踩坑,有需要的同学可以收藏、点赞。
15 0
|
网络安全 网络架构
在SIP 语音呼叫中出现单通时要怎么解决?
​ 在VoIP的环境中,特别是基于SIP通信的环境中,我们经常会遇到一些非常常见的问题,例如,单通,注册问题,回声,单通等。这些问题事实上都有非常直接的排查方式和解决办法,用户可以按照一定的排查方式,工具非常高效地解决这些问题。但是,因为技术水平参差不齐,网络上的很多技术也不完整。根据一些用户的使用环境和用户经常遇到一些问题,我们来聊一下以下的问题,并且给出了相应的排查方式,用户可以按照这个方法来解决SIP通话中的问题,有关系统问题看博主名一起交流学习 **在SIP 语音呼叫中,一些用户也经常遇到单通的问题**,简单来说,就是双方呼叫时,只能听到一方的语音。单通问题的主要原因来自于以下几
在SIP 语音呼叫中出现单通时要怎么解决?
|
监控 安全 Linux
处理SIP的voip语音环境问题的方法
在VoIP的环境中,特别是基于SIP通信的环境中,我们经常会遇到一些非常常见的问题,例如,单通,30秒就断线,注册问题,回声等。这些问题事实上都有非常直接的排查方式和解决办法,用户可以按照一定的排查方式,工具非常高效地解决这些问题。但是,因为读者技术水平参差不齐,网络上的很多技术也不完整。笔者今天系统归纳了这些问题。根据一些用户的使用环境和用户经常遇到一些问题,我们列举了以下十个在SIP呼叫中经常遇到的问题,并且给出了相应的排查方式,用户可以按照这些方法来解决SIP通话中的这些问题,有关系统问题欢迎喂博主一起交流学习。这十个经典的问题包括: 不能注册或呼叫到SIP服务器端 30秒挂断呼叫的
|
编解码 网络架构
VOIP呼叫流程
1) 用户摘机,模块化语音插卡实时检测用户的摘机动作。 (2) 模块化语音插卡将摘机信号传递给路由器上的VoIP信号处理模块。 (3) 用户听到VoIP的会话应用程序播放的拨号音,然后开始拨号(但应在拨号音超时之前拨号)。 (4) VoIP会话应用程序收集用户拨打的号码。 (5) VoIP会话应用程序在收集号码过程中实时地与已配置的被叫号码模板进行匹配。 (6) 当成功匹配某个已配置的被叫号码模板后,号码将被映射至某语音网关(此语音网关直接连接目的电话或用户小交换机PBX)。 (7) 主叫语音网关通过IP网络利用H.323建议向被叫网关发起语音呼叫,并为每路呼叫建立通道,用以发送和
|
存储 负载均衡 安全
|
存储 应用服务中间件 网络性能优化
SIP的voip语音环境咬线或摘机状态什么处理
SIP的voip语音环境咬线或摘机状态什么处理
SIP的voip语音通话后30秒左右挂断呼叫怎么解决
SIP的voip语音通话后30秒左右挂断呼叫怎么解决
|
编解码 Linux
基于Asterisk的VoIP开发指南——(1)实现基本呼叫功能
原文: 基于Asterisk的VoIP开发指南——(1)实现基本呼叫功能 说明:        1.本文档探讨基于Asterisk如何实现VoIP的一些基本功能,包括基本呼叫功能的方案选取、主叫号码透传、如何编写Asterisk AGI程序、Radius认证计费模块等。
3776 0