天上星,加油!

在Internet传播声音

 在几年以前IP电话被炒的沸沸扬扬,但用过的人都觉得这个技术非常不成熟,语音质量很差,时断时续,还经常有延迟,结果这项技术的应用没有普及开来。但随着Internet应用的越来越广泛以及相关技术发展的日新月异,声音质量不断提高,通过Internet打电话早已不再是梦想,已经成为了我们生活中的一部分。今天我使用IP电话打长途,每分钟只需要3毛钱,使用OICQ的语音聊天,网友仿佛就在你的身边。如果我们的带宽足够的,我们甚至还可以在网上收看Quicktime视频直播,用RealAudio收听电台广播,也可以点播好听的MP3歌曲。不过对于程序员来说,更好的消息是我们对于这些媒体流的编程也也变得越来越容易。为什么这么说呢,下面让我们先来了解一下Codec

 Codecs

  什么是Codecs?其实它就是音频压缩的解码编码器,实际上有点类似ActiveX控件。ActiveX控件使程序员可以调用一些他人实现好的功能而无需从头做起。Codecs提供了类似的功能,只不过它集中在提供如何对媒体格式进行转换的功能。例如,如果想写一个把CD转MP3的应用程序,我们只需要做下列工作:

 l         CD音轨中读取数据。

 l         生成一个有效的MP3文件头。

 l         调用相应的codec把音轨数据编码为MP3。

Windows本身已经带了很多的codec。下面是其中几个的说明:

名称

说明

GSM

好像用于某些移动电话网络。

DSP TrueSpeech

可以生成一种一位的声音格式用于语音通话-声音非常清楚。

Fraunhoffer IIS MP3

这种可以用来生成MP3格式。

PCM

用于生成Windows标准声音格式。大多数Codec支持的声音格式都可以和它相互转化。

  当前安装的codec的完整列表可以通过察看控制面板中多媒体的部分来获得。 

ACM API

  ACM是"Audio Compression Manager"缩写,翻译过来就是声音压缩管理器。它是微软编写的用于调用Codec功能的接口函数库。它本来应该声明在MMSystem.pas单元中,但是由于某些原因Borland把它给省略了。所以我们要作的第一件事是找到它的API声明单元MSACM.pas。必须要感谢Francois Piette,他共享了他转换的单元文件,我们可以从www.Delphi-Jedi.org下载它。

  使用ACM转换媒体格式包括以下几步:

  l         首先必须指定输入输出格式,我们需要设定TWaveFormatEX记录, 但是这个结构记录太小无法容纳大多数Codec所需要的信息。为了解决这个问题,我们使用一个自定义的 TACMFormat记录,这个记录在TWaveFormatEX的基础上增加了128字节。

  l         打开一个ACM流。首先调用acmStreamOpen函数,把输入输出格式作为参数传递过去。然后ACM或者返回一个有效的句柄或者返回一个错误代码(比如ACMERR_NotPossible)来表明转换的请求无法完成。

  l         接下来要确定输出缓冲区的大小。调用acmStreamSize函数会通知ACM每次我们将生成多少字节的数据,然后函数会返回请求大小的缓冲区(我们总是应该高估一下大小,保证提供一个足够大的缓冲区)。

  l         然后,我们要生成一个转换头。需要调用acmStreamPrepareHeader函数,把先前调用acmStreamOpen函数返回的流句柄作为参数。生成的转换头会告诉ACM源缓冲区和目的缓冲区的地址。ACM不会自动分配内存,我们必须自己来申请内存。

  l         所有的准备工作基本上完成了,只剩下如何转换数据了。这是非常简单的,只需要调用acmStreamConvert函数。AcmStreamConvert函数的参数包括流句柄和转换头句柄。这个函数通过设定转换头中的cbDstLengthUsed表明转换过程中真正被使用的字节数。

  l         一旦完成了ACM的会话,我们必须释放使用的全部资源。转换头用acmStreamUnprepareHeader函数来释放,流用acmStreamClose来关闭。

 选择格式

  正如前面提到的,在开始转换以前必须先设定输入输出格式。TWaveFormatEX记录(声明在MMSystem.pas单元中),它仅仅指定了比特率,频率等等。除非我们只打算在不同的PCM格式间进行转换,否则TWaveFormatEX是不够用的。下面是它的替代格式:

TACMWaveFormat =packedrecord

     case integer of

       0 :(Format : TWaveFormatEx);

       1 :(RawData :Array[0..128]of byte);

   end;

  这个变体记录使我们仍然可以读取TWaveFormatEX结构数据,同时RawData提供了足够的空间来容纳其它Codec需要的额外信息。

  虽然我们不知道额外信息的大小,但我们可以使用acmFormatChoose函数来获得。

  AcmFormatChoose函数只需要一个TACMFormatChooseA类型的参数。这个参数是一个简单的结构可以包括下列信息:

成员

说明

posted on 2008-11-28 17:21 Peter.Lian 阅读(84) 评论(0)  编辑  收藏

My Links

Blog Stats

常用链接

留言簿(1)

随笔档案

文章分类

文章档案

搜索

最新评论

阅读排行榜

评论排行榜