PHP实现基于文本的摩斯电码生成器


Posted in PHP onJanuary 11, 2016

最近遇到一个基于输入文本生成摩斯代码音频文件的需求。几番搜索无果之后,我决定自己编写一个生成器。

PHP实现基于文本的摩斯电码生成器

因为我希望通过web的方式访问我的摩斯代码音频文件,所以我决定采用PHP作为我主要的编程语言。上面的截图显示了一个开始生成莫斯代码的网页。在下载的zip文件中,包含了用于提交文本的网页以及用于生成和展现音频文件的PHP源文件。如果你想测试PHP代码,你需要将网页和相关的PHP文件复制到启用了PHP的服务器上。

对于许多人来说,莫斯代码就像一些老电影中表现的那样,就是一些“点”和“横线”的序列,或者一连串的哔哔声。显然,如果你想用计算机代码来生成莫斯代码,这样的了解是远远不够的。这篇文章将会介绍生成莫斯代码的要素,如何生成WAVE 格式的音频文件,以及如何用PHP将莫斯代码转化成音频文件。

莫斯代码

莫斯代码是一种文本编码方式。它的优点是编码方便,而且用人耳就能够方便的解码。本质上,是通过音频(或者无线电频)的开和关,从而形成或短或长的音频脉冲,一般称作点(dot)和线(dash),或者用无线电术语称作“嘀”和“嗒”。用现代数字通信术语,莫斯代码是一种振幅键控(amplitude shift keying ,ASK)。

在莫斯代码中,字符(字母,数字,标点符号和特殊符号)被编码成一个“嘀”和“嗒”的序列。所以为了把文本转化成莫斯代码,我们首先要确定如何来表示“嘀”和“嗒”。一个很显然的选择就是,用0表示“嘀”,用1表示“嗒”,或者反过来。不幸的是,莫斯代码采用的是可变长编码方案。所以我们也必须要使用一种可变长序列,或者采取一种方式,把数据打包成一种计算机内存通用的固定位宽(fixed bit-size)的格式。另外,需要特别注意的是,莫斯代码并不区分字母大小写,而且对一些特殊符号无法编码。在我们这个实现中,未定义的字符和符号将会被忽略。

在这个项目中,内存占用并不是一个需要特别考虑的问题。所以,我们提出一个简单的编码方案,即用“0”来表示每个“嘀”,用“1”来表示每个“嗒”,并且把他们放在一个字符串关联数组中。定义莫斯代码编码表的PHP代码就像下面这样:

$CWCODE = array ('A'=>'01','B'=>'1000','C'=>'1010','D'=>'100','E'=>'0',
  'F'=>'0010','G'=>'110','H'=>'0000','I'=>'00','J'=>'0111',
  'K'=>'101','L'=>'0100','M'=>'11','N'=>'10', 'O'=>'111',
  'P'=>'0110','Q'=>'1101','R'=>'010','S'=>'000','T'=>'1',
  'U'=>'001','V'=>'0001','W'=>'011','X'=>'1001','Y'=>'1011',
  'Z'=>'1100', '0'=>'11111','1'=>'01111','2'=>'00111',
  '3'=>'00011','4'=>'00001','5'=>'00000','6'=>'10000',
  '7'=>'11000','8'=>'11100','9'=>'11110','.'=>'010101',
  ','=>'110011','/'=>'10010','-'=>'10001','~'=>'01010',
  '?'=>'001100','@'=>'00101');

需要注意的是,如果你特别在意内存占用的话,上面的代码可以解释为位(bit)。给每个代码增加一个开始位,就可以形成一个位的模式,每个字符就可以用一个字节来储存。同时,当解析最终编码的时候,要删除开始位左边的位(bit),从而获得真正的变长编码。

尽管许多人没有意识到,事实上“时间间隔”是定义莫斯代码的主要因素,所以理解这一点是生成莫斯代码的关键。所以,我们要做的第一件事,就是定义莫斯代码的内部码(即“嘀”和“嗒”)的时间间隔。为了方便起见,我们定义一个“嘀”的声音长度为一个时间单位dt,“嘀”和“嗒”之间的间隔也是一个时间单位dt;定义一个“嗒”的长度为3个dt,字符(letters)之间的间隔也是3个dt;定义单词(words)之间的间隔是7个dt。所以,总结起来,我们的时间间隔表就像下面这样:

PHP实现基于文本的摩斯电码生成器

在莫斯代码中,编码声音的“播放速度”通常用 单词数/分钟(WPM) 来表示。由于英文单词有不同的长度,而且字符也有不同数量的“嘀”和“嗒”,所以,从WPM转化成(音频)数字采样并不是看上去那样简单。在一份被国际组织采用的方案中,采用5个字符作为单词的平均长度,同时,一个数字或标点符号被当做2个字符。这样,平均一个单词就是50个时间单位dt。这样,如果你指定了WPM,那么我们总的播放时间就是 50 * WPM的时间单位/分钟,每个“嘀”(即一个时间单位dt)的长度等于1.2/WPM秒。这样,给出一个“嘀”的时间长度,其他元素的时间长度很容易就能够计算出来。

你可能已经注意到,在上面显示的网页中,对于低于15WPM的选项,我们使用了“Farnsworth spacing”。那么这个“Farnsworth spacing”又是个什么鬼?

当报务员学习用耳朵来解码莫斯代码的时候,他就会意识到,当播放速度变化的时候,字符出现的节奏也会跟着变化。当播放速度低于10WPM的时候,他能够从容的识别“嘀”和“嗒”,并且知道发送的哪个字符。但是当播放速度超过10WPM的时候,报务员的识别就会出错,他识别出来的字符会多于实际的“嘀”和“嗒”。当一个学习的时候习惯低速莫斯代码的人,在处理高速播放代码的时候,就会出现问题。因为节奏变了,他潜意识的识别就会出错。

为了解决这个问题,“Farnsworth spacing”就被发明出来了。本质上来讲,字母和符号的播放速度依然采取高于15WPM的速度,同时,通过在字符之间插入更多的空格,来使整体的播放速度降低。这样,报务员就能够以一个合理的速度和节奏来识别每个字符,一旦所有的字符都学习完毕,就可以增加速度,而接收员只需要加快识别字符的速度就可以了。本质上来说,“Farnsworth spacing”这个技巧解决了节奏变化这个问题,使接收员能够快速学习。

所以,在整个系统中,对于更低的播放速度,都统一成15WPM。相对应的,一个“嘀”的长度是0.08秒,但是字符之间和单词之间的间隔就不再是3个dit或者7个dit,而是进行的调整以适应整体速度。

生成声音

在PHP代码中,一个字符(即前面数组的索引)代表一组由“嘀”、“嗒”和空白间隔组成的莫斯声音。我们用数字采样来组成音频序列,并且将其写入到文件中,同时加上适当的头信息来将其定义成WAVE格式。

生成声音的代码其实相当简单,你可以在项目中PHP文件中找到它们。我发现定义一个“数字振荡器”相当方便。每调用一次osc(),它就会返回一个从正玄波产生的定时采样。运用声音采样和声频规范,生成WAVE格式的音频已经足够了。在产生的正玄波中的-1到+1之间是被移动和调整过的,这样声音的字节数据可以用0到255来表示,同时128表示零振幅。

同时,在生成声音方面我们还要考虑另外一个问题。一般来讲,我们是通过正玄波的开关来生成莫斯代码。但是你直接这样来做的话,就会发现你生成的信号会占用非常大的带宽。所以,通常无线电设备会对其加以修正,以减少带宽占用。

在我们的项目中,也会做这样的修正,只不过是用数字的方式。既然我们已经知道了一个最小声音样本“嘀”的时间长度,那么,可以证明,最小带宽的声幅发生在长度等于“嘀”的正玄波半周期。事实上,我们使用低通滤波器(low pass filter)来过滤音频信号也能达到同样的效果。不过,既然我们已经知道所有的信号字符,我们直接简单的过滤一下每一个字符信号就可以了。

生成“嘀”、“嗒”和空白信号的PHP代码就像下面这样:

while ($dt < $DitTime) {
 $x = Osc();
 if ($dt < (0.5*$DitTime)) {
 // Generate the rising part of a dit and dah up to half the dit-time
 $x = $x*sin((M_PI/2.0)*$dt/(0.5*$DitTime));
 $ditstr .= chr(floor(120*$x+128));
 $dahstr .= chr(floor(120*$x+128));
 }
 else if ($dt > (0.5*$DitTime)) {
 // For a dah, the second part of the dit-time is constant amplitude
 $dahstr .= chr(floor(120*$x+128));
 // For a dit, the second half decays with a sine shape
 $x = $x*sin((M_PI/2.0)*($DitTime-$dt)/(0.5*$DitTime));
 $ditstr .= chr(floor(120*$x+128));
 }
 else {
 $ditstr .= chr(floor(120*$x+128));
 $dahstr .= chr(floor(120*$x+128));
 }
 // a space has an amplitude of 0 shifted to 128
 $spcstr .= chr(128);
 $dt += $sampleDT;
 }
// At this point the dit sound has been generated
// For another dit-time unit the dah sound has a constant amplitude
$dt = 0;
while ($dt < $DitTime) {
 $x = Osc();
 $dahstr .= chr(floor(120*$x+128));
 $dt += $sampleDT;
 }
// Finally during the 3rd dit-time, the dah sound must be completed
// and decay during the final half dit-time
$dt = 0;
while ($dt < $DitTime) {
 $x = Osc();
 if ($dt > (0.5*$DitTime)) {
 $x = $x*sin((M_PI/2.0)*($DitTime-$dt)/(0.5*$DitTime));
 $dahstr .= chr(floor(120*$x+128));
 }
 else {
 $dahstr .= chr(floor(120*$x+128));
 }
 $dt += $sampleDT;
 }

WAVE格式的文件

WAVE是一种通用的音频格式。从最简单的形式来看,WAVE文件通过在头部包含一个整数序列来表示指定采样率的音频振幅。关于WAVE文件的详细信息请查看这里Audio File Format Specifications website。对于产生莫斯代码,我们并不需要用到WAVE格式的所有参数选项,仅仅需要一个8位的单声道就可以了,所以,so easy。需要注意的是,多字节数据需要采用低位优先(little-endian)的字节顺序。WAVE文件使用一种由叫做“块(chunks)”的记录组成的RIFF格式。

WAVE文件由一个ASCII标识符RIFF开始,紧跟着一个4字节的“块”,然后是一个包含ASCII字符WAVE的头信息,最后是定义格式的数据和声音数据。

在我们的程序中,第一个“块”包含了一个格式说明符,它由ASCII字符fmt和一个4倍字节的“块”。在这里,由于我使用的是普通脉冲编码调制(plain vanilla PCM)格式,所以每个“块”都是16字节。然后,我们还需要这些数据:声道数、声音采样/秒、平均字节/秒、一个区块(block)对齐指示器、位(bit)/声音采样。另外,由于我们不需要高质量立体声,我们只采用单声道,我们使用 11050采样/秒(标准的CD质量音频的采样率是 44200采样/秒)的采样率来生成声音,并且用8位(bit)保存。

最后,真实的音频数据储存在接下来的“块”中。其中包含ASCII字符data,一个4字节的“块”,最后是由字节序列(因为我们采用的是8位(bit)/采样)组成的真实音频数据。

在程序中,由8位音频振幅序列组成的声音保存在变量$soundstr中。一旦音频数据生成完毕,就可以计算出所有的“块”大小,然后就可以把它们合并在一起写入磁盘文件中。下面的代码展示了如何生成头信息和音频“块”。需要注意的是,$riffstr表示RIFF头,$fmtstr表示“块”格式,$soundstr表示音频数据“块”。

$riffstr = 'RIFF'.$NSizeStr.'WAVE';
$x = SAMPLERATE;
$SampRateStr = '';
for ($i=0; $i<4; $i++) {
 $SampRateStr .= chr($x % 256);
 $x = floor($x/256);
 }
$fmtstr = 'fmt '.chr(16).chr(0).chr(0).chr(0).chr(1).chr(0).chr(1).chr(0)
   .$SampRateStr.$SampRateStr.chr(1).chr(0).chr(8).chr(0);
$x = $n;
$NSampStr = '';
for ($i=0; $i<4; $i++) {
 $NSampStr .= chr($x % 256);
 $x = floor($x/256);
 }
$soundstr = 'data'.$NSampStr.$soundstr;

总结和评论

我们的文本莫斯代码生成器目前看起来还不错。当然,我们还可以对它做很多的修改和完善,比如使用其他字符集、直接从文件中读取文本、生成压缩音频等等。因为我们这个项目的目的是使其能够在网络上方便的使用,所以我们这个简单的方案,已经达到我们的目的了。

当然,一如既往的,希望大家对这些简单粗暴的代码提出建议。

PHP 相关文章推荐
深入extjs与php参数交互的详解
Jun 25 PHP
实测在class的function中include的文件中非php的global全局环境
Jul 15 PHP
PHP-Fcgi下PHP的执行时间设置方法
Aug 02 PHP
Yii框架中 find findAll 查找出制定的字段的方法对比
Sep 10 PHP
一个php生成16位随机数的代码(两种方法)
Sep 16 PHP
PHP入门教程之数学运算技巧总结
Sep 11 PHP
form表单传递数组数据、php脚本接收的实例
Feb 09 PHP
简单谈谈 php 文件锁
Feb 19 PHP
PHP获取当前执行php文件名的代码
Mar 02 PHP
PHP实现的解汉诺塔问题算法示例
Aug 06 PHP
PHP反射学习入门示例
Jun 14 PHP
php 根据URL下载远程图片、压缩包、pdf等文件到本地
Jul 26 PHP
简单了解WordPress开发中update_option()函数的用法
Jan 11 #PHP
WordPress后台中实现图片上传功能的实例讲解
Jan 11 #PHP
在WordPress的后台中添加顶级菜单和子菜单的函数详解
Jan 11 #PHP
在WordPress中获取数据库字段内容和添加主题设置菜单
Jan 11 #PHP
[原创]PHP简单开启curl的方法(测试可行)
Jan 11 #PHP
详解YII关联查询
Jan 10 #PHP
PHP 设计模式系列之 specification规格模式
Jan 10 #PHP
You might like
为php4加入动态flash文件的生成的支持
2006/10/09 PHP
腾讯QQ微博API接口获取微博内容
2013/10/30 PHP
CodeIgniter框架URL路由总结
2014/09/03 PHP
php中常见的sql攻击正则表达式汇总
2014/11/06 PHP
更正确的asp冒泡排序
2007/05/24 Javascript
JQuery在光标位置插入内容的实现代码
2010/06/18 Javascript
jQuery 全选/反选以及单击行改变背景色实例
2013/07/02 Javascript
js获取当前页面的url网址信息
2014/06/12 Javascript
JavaScript获取网页中第一个图片id的方法
2015/04/03 Javascript
javascript实现完美拖拽效果
2015/05/06 Javascript
window.open打开窗口被拦截的快速解决方法
2016/08/04 Javascript
jQuery实现隔行变色的方法分析(对比原生JS)
2016/11/18 Javascript
JS Input里添加小图标的两种方法
2017/11/11 Javascript
微信小程序实现多选功能
2018/11/04 Javascript
JS执行控制之节流模式实例分析
2018/12/21 Javascript
js实现unicode码字符串与utf8字节数据互转详解
2019/03/21 Javascript
JavaScript 作用域实例分析
2019/10/02 Javascript
vue实现移动端触屏拖拽功能
2020/08/21 Javascript
Javascript中Math.max和Math.max.apply的区别和用法详解
2020/08/24 Javascript
Python文件操作类操作实例详解
2014/07/11 Python
Python常见加密模块用法分析【MD5,sha,crypt模块】
2017/05/24 Python
pandas获取groupby分组里最大值所在的行方法
2018/04/20 Python
如何优雅地改进Django中的模板碎片缓存详解
2018/07/04 Python
初次部署django+gunicorn+nginx的方法步骤
2019/09/11 Python
python 浅谈serial与stm32通信的编码问题
2019/12/18 Python
python3 deque 双向队列创建与使用方法分析
2020/03/24 Python
如何将anaconda安装配置的mmdetection环境离线拷贝到另一台电脑
2020/10/15 Python
python使用yaml 管理selenium元素的示例
2020/12/01 Python
利用三角函数在canvas上画虚线的方法
2018/01/11 HTML / CSS
美国波道夫·古德曼百货官网:Bergdorf Goodman
2017/11/07 全球购物
机电一体化专业求职信
2014/07/22 职场文书
工作经验交流材料
2014/12/30 职场文书
就业意向协议书
2015/01/29 职场文书
房地产置业顾问岗位职责
2015/04/11 职场文书
青年志愿者服务活动总结
2015/05/06 职场文书
食堂卫生管理制度
2015/08/04 职场文书