《家庭语音控制系统》报告.doc
《《家庭语音控制系统》报告.doc》由会员分享,可在线阅读,更多相关《《家庭语音控制系统》报告.doc(47页珍藏版)》请在沃文网上搜索。
1、前言什么才是让生活更“方便”。方便,是动一动拇指来操控一些家中的控制程序?方便,是看一看监控视频来知晓家中的一切?方便,是.。到底怎么样的“方便”才可以回答生活上的方便。以上提到的“方便”确实能够满足我们生活上的方便,但是只有这些“方便”是美中不足的,要尽可能的增加更多“方便”在我们的生活中,那样才可以真正的做到方便我们的生活,才是真正意义上的“智能生活”。 想过没有,一句话的事儿。用说“一句话”去命令和操控家中的智能家居控制系统。放眼整个软件行业,不论是苹果手机、苹果电脑,还是百度输入法、腾讯的微信、米聊、UC的浏览器以及新浪的微博等等一些应用程序,都已经成为当下很多人以此取代传统短信进行交
2、流的必备工具,这些软件在手机终端上面都有语音控制的功能。简单说,就是“一句话”的事儿就可以控制和操作一些程序和系统。如:在苹果手机上面,打开语音控制键后,说出你想要的功能或软件的名字,系统就会自动的将您需要的程序调出来,不用再在繁多的应用程序中,辛苦的找寻自己想要用的程序了。又如:百度输入法中,也有一个语音控制功能,只需按下那个“麦克风”似的按键,说出你想打出的字、词或句,该输入法就可以将说的内容以文字的形式出现在打字的框框中,省去了一个一个字母打字的麻烦,也节省了不少的时间。甚至,语音还控制了手机中的照相系统,一句“拍”,照相机就开始启动照相了,是不是有点不可思议,但是现在的实际情况,这个是
3、真实存在的,而且,的确是十分方便易用的。以上提及的这些都是用“语音”控制的,当然这些只是小编简单阐述的一部分。当然,还有很多的这样的例子,在这里就不一一介绍了。市场上,各大厂商应广大消费者的需求以及人性化的设计理念,各大IT巨头都在“智能语音”市场上积极的布局、创新以及设计研发更多的语音智能化产品,只有这样的创新开发,才有可能让企业和产品“永葆青春”。所以我想在家庭电器控制方面进行设计,满足社会越来越需要方便的生活,简单而且实用,应用范围也广,我们都有过深心体验,在家里,开灯往往是件麻烦事,在漆黑的晚上,到处在找电灯的开关而烦恼,小孩子想开灯但是又够不着开关而烦恼,当独自一人在家没人陪而烦恼,
4、为想睡懒觉不想起床拉开窗帘而烦恼等等的这些都可以通过语音来控制,也就是简单的一句话,她就可以为您服务,简单的一句话,就可以为您带来无限的乐趣,简单的一句话,就可以帮你哄孩子睡觉,简单的一句话,就可以给小孩子讲故事等等。语音控制真的毫无疑问在未来社会发展中,将会从手动遥控的打开方式转变为靠说就可以的形式,所以我就设计了一款家庭语音控制系统。 目录家庭语音控制系统的简介-4家庭语音控制系统的组成模块-4语音控制系统的各大模块的功能和介绍-4语音采集模块功能-4【1】 口令检测模式:-5【0】 普通检测模式:-5麦克风的设置:-5语音模块的常遇问题和解决方法-6常遇问题:-6单片机如何发送ASR指令
5、的-7小兰我为其设置的指令程序-7单片机温度采集显示模块-9中央总处理单片机-9电压功率显示模块-10A. 功能-10B. 外形圖,按键功能說明-10按键盘/LCD功能說明-11C.功能設定-11D.功能及显示-12参数-12电流-13电量-13功率-14时间-14E.注意事项-14F.规格参数-14单片机电压测量显示模块-15家庭250v10A控制继电器模块 8位-16Mp3播放器模块-16模块特点-16面板按键说明-17遥控按键说明-17电源供电模块-18按键模块-18家庭语音控制系统整体介绍-18制作过程-18-总结-19温度检测显示程序-20中央处理程序-30 正文一、 家庭语音控制系
6、统的简介 我把它命名叫做小兰,她是一个语气平和的女士的声音,她没有设置特定语音识别的特性,什么人都是可以唤醒她的,所以她无论是主人还是客人,都可以唤醒她,这样就免去为特定人而设计特定的语音识别程序了,可以说她是一个大众化得语音识别系统,但是因为其在语音采集模块中是需要标准的普通话识别的,所以说她也是一个可以训练普通话的好帮手,她的工作方式是将声音转化成单片机可以识别的数字信号的,在唤醒她时是需要叫她兰的,比如“兰开灯”她将会回答你“好的,主人小兰马上为您开灯”并作出反应打开电灯。二、 家庭语音控制系统的组成模块 我设计的家庭语音控制系统,可以分为以下模块:1、 语音采集模块2、 单片机温度采集
7、显示模块3、 中央总处理单片机4、 电压功率显示模块5、 单片机电压测量显示模块6、 家庭250v10A控制继电器模块 8位7、 Mp3播放器模块8、 电源供电模块9、 按键模块三、 语音控制系统的各大模块的功能和介绍(一) 语音采集模块功能1、 所采用的单片机是STC11L16XE,这是一种高速单片机,内部已经写入了语音的识别采集程序,模块需要通过usb转换模块进行转换,就可以和电脑在线实时通信,方便写入主要的控制程序。2、 下面试语音控制模块的关键控制程序及使用说明: 【00】:关键词所在的行,模块最多只能存入50行,取值范围:00-49,每条关键词占一行,不能重叠。【bei jing】:
8、需要识别的词语或者句子,文字的拼音用空格键隔开。【001】:对应SD卡中语音文件的名称,同时也是串口输出的返回值,取值范围:001-254(十进制)。【指令的功能】:识别到人讲“北京”两个字时,播放SD卡中以“0001.AD4”命名的语音文件,同时从串口输出数据“1”,用单片机等可编程器件处理此数据便能做成语音控制系统。【举例】:识别到人讲“开灯”两个字时,播放SD卡中以“0026.AD4”命名的语音文件,同时从串口输出数据“26”(“26”也就是16进制的“1A”),此命令应该这样写:00,kai deng,026,$erase$ 此程序为语音模块的擦除程序,可以擦除所有已经写入的控制识别程
9、序,但是这个程序一旦写入,所有程序就要从新写入。enrst,1,$ 值为“1”时,每次向模块发送命令后模块自动重启,命令立即生效。值为“0”时, 需手动复位模块后命令才生效。【9600】模块波特率。模块支持1200,2400,4800,7200,9600,14400,19200,38400,57600,115200Baud共10种波特率,发货时默认为9600Baud,客户可以根据自己的实际情况更改。注意:波特率更改后立即生效,重新选择波特率后才能再次发送和接收命令。我们现在使用的是9600的波特率。Start,FF,End,EE,Enable,0,$【FF】指令的开始标志,用户可任意设置。【E
10、E】指令的结束标志,用户可任意设置。【1】命令使能。【命令使能位为“1”时,串口输出格式如下】:例:设置关键词发送指令:00,beijing,219,$识别到“北京”之后,串口输出的数据为:“FF 21 09 2A EE”,其中“FF”和“EE”分别为开始标志和结束标志,“21”是指令返回值的十位和百位(十六进制数),“09”是返回值的个位(十六进制数),“2A”是21+09的和(十六进制数)。如果接收端接收到的数据不符合这个加法运算,说明数据传输过程中出错,接收端可通过发送“重发上一次识别结果”指令“ReSend$”通知模块再重新发送一次,这样可以有效避免传输出错。【命令使能位为“1”时,串
11、口输出格式如下】:直接输出指令的返回值对应的十六进制数。例如,设置关键词发送指令:00,beijing,219,$识别到“北京”之后,串口直接输出指令返回值“219”的十六进制数:“DB”。【1】口令检测模式:设置一个关键词,然后将返回值设置成254,这个关键词将作为进入其他关键词识别的入口,这个关键词我们称为“口令”。在没有识别到口令之前,其他所有的关键词都无法识别。在识别到口令之后,必须在8秒钟之内说出要识别的关键词,否者又要重新讲口令之后方可识别。这种方式可以有效的降低误识别率。识别到口令之后,模块首先会播放SD卡中以“0254.AD4”命名的音频文件,播放完毕后再通过串口自动发送“FF
12、 AA AA EE”。建议“0254.AD4”作为提示音,例如“提示:请在8秒钟之内确认!”串口返回的“FF AA AA EE”则可作为设备端的准备信号。【0】普通检测模式:不需要口令所有的关键词都可以随时被识别。麦克风的设置:【078】:可理解为麦克风输入信号的摄取量,此值不宜过高,否者会导致信号输入载波,无法检测语音。取值范围:000-127【08】:可理解为麦克风输入信号的放大系数,值为00时放大能力最好,值为79时放大能力最差。取值范围:00-79【1】:此值为“0”时,语音播放过程中不允许检测。此值为“1”时,播放语音的过程中允许检测。取值范围:0-1小提示:如果发现麦克风检测不到语
13、音时,请用此命令的默认值设置后再试试。因为每个麦克风的造工都不同,所以每更换一个外置麦克风都需要重新设置这两个参数(当然,没插入外置麦克风的时候事实上设置的就是内置麦克风的参数),请细心调节这两个数值,直到检测距离最远抗环境噪声能力最好为止。ReSend$重新返回上次输出的结果。在单片机系统应用中,如果数据传输出错,发送此指令给模块可重新获取上一次识别结果。模块支持1200,2400,4800,7200,9600,14400,19200,38400,57600,115200Baud共10种波特率,发货时默认为9600Baud,客户可以根据自己的实际情况更改。注意:波特率更改后立即生效,重新选择
14、波特率后才能再次发送和接收命令。SD_INI,0000,$SD_INI,0000,$命令主要用于设置SD卡的初始化等待时间,如果发现模块播放不了语音文件就要好好利用此命令。【0000】:SD卡初始化等待时间,单位为毫秒。0000指0毫秒。注意:一般情况下0000就能正常读卡。如果发现不能读卡,请将此值设置0550以上,值为0900时还是读不了卡那就基本没希望了,换卡吧!卡的容量需要1GB以下,SD卡使用前要事先格式化为FAT格式,卡内只能存放AD4格式的音频文件,其他无用的文件请移除。以上就是语音控制模块的主要程序控制,内部的主程序我们是无法知道的,这毕竟是生产厂家的商业秘密的。3、 语音模块
15、的常遇问题和解决方法常遇问题:1.问什么ASR设置器.exe界面突然不显示返回值了?2.为什么我和别人谈话模块也识别到了?误识别率很高?3.为什么我不讲话也被识别到了?4.为什么发送命令总会显示一部分乱码?5.为什么语音播放一段后自动停止了?6.为什么播放不了SD卡中的音频文件?7.我把返回值设置成255,为什么模块识别到之后不返回255也不播放SD卡中的音频文件,似乎不做任何动作。8.为什么插入耳机的音量很小?9.为什么我没讲话指示灯也会闪烁?11.在极少数情况下观察到指示灯不停的快闪,一阵子又不闪了。12.为什么模块不接收指令了?解决方法:1问:问什么ASR设置器.exe界面突然不显示返回
16、值了? 发送命令也无返回提示了,是不是模块有问题?答:1.请把ASR设置器.exe软件关掉,再把USB设置器从USB 口拔出,然后重新插入USB设置器,再打开ASR设置 器.exe软件,一般情况下就恢复正常了,是电脑串口 出现异常所致,非模块有问题。 2.可以尝试更简单的方法,点击ASR设置器.exe软件正上 放“关闭”按钮,点击之后按钮旁边的红色方块会变成 蓝色,然后再点击“打开”,如无意外这样就恢复正常 了。不行的话再按照第一种方法去做。2问:为什么我和别人谈话模块也识别到了?误识别率很高。答:可以设置“垃圾管关键词”吸收掉错误的发音,尽量消除误识别。详情请看如何提高模块的识别率.pdf第
17、1条。3问:为什么我不讲话也被识别到了?答:播放SD卡中的音频文件的同时,模块又重新检测到了那个 关键词,所以又重复播放,然后又检测到了,不断循环。 解决办法:点击右下角“麦克风灵敏度计增益设置、语音 播放时是否允许检测”这条指令,将指令修改成 mic_vol,078,vag,08,bnv,0,$ ,注意1改成0了,意思就 是播放SD卡中的语音文件时不允许检测。这样就OK了。4问:为什么波特率较低时,ASR设置器.exe界面显示的中文很多乱码?答:因为计算机软件在分析简体中文编码时是以串口接收到的两个数字之间的时间作为限定的,中文简体编码是2个8位二进制数据组成,必须在规定的时间之内把这两个8
18、位的二进制数传送到电脑上电脑才能识别出来这是个中文。如果波特率太低的话,传送数据的速度太慢,所以电脑分辨不出来,然后就造成了显示乱码。事实上,ASR M08-A模块从串口输出的数据是绝对100%正确的,大家无需担心,有时候清空一次再发送就能显示出来了。显示只是个提示其实如果命令发送成功了就行了,不用管接收区的提示乱码问题。那是电脑的处理上的问题,和模块无关,波特率越大出现乱码的机率就越小。5问:为什么语音播放一段后自动停止了?答:电池没电了,更换电池。建议把电池盒的电源线剪 断,然后接入5V电压供电。记住红线为正极,黑线 为负极,千万别接错,否者会烧毁模块。6问:为什么播放不了SD卡中的音频文
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 家庭语音控制系统 家庭 语音 控制系统 报告
