目录

微软的技术,直接颠覆了我对听书这件事的看法

微软的技术,直接颠覆了我对听书这件事的看法

阿虚一度是对听书不太感兴趣的 (虽然一大部分原因是我看的小说没有有声书) ,AI机械式的发音,固定的腔调、语速,总会丢失那些波澜起伏的剧情所带来的沉浸式情感体验 https://i-blog.csdnimg.cn/blog_migrate/85cf70a6a6269c04edae9ba60830fcc2.gif

但最近才知道微软在 //Build 2021 大会上,发布了旗下 TTS 2021版的人工语音,让我对听书这件事简直是有了革新式的看法 https://i-blog.csdnimg.cn/blog_migrate/5f44790f34827be38db670d5372e7489.png

大家可以听听官方网页的示例,新增的这5种中文语音,根本听不出是机器在念,逼真地吓人:

https://i-blog.csdnimg.cn/blog_migrate/8e090543d52b576157276eaac7d8daec.png

对于喜欢 听书 的人来说,估计和阿虚一样心里只有一个想法吧:赶紧让我体验一下!!!

https://i-blog.csdnimg.cn/blog_migrate/f0a68dcd10ecc28102e72dd32b61df30.gif

总之阿虚今天就准备来介绍一下 安卓/iOS 上分别怎么用上微软这些最新的TTS语音!

TTS对于多数人,肯定还是用于手机上看小说,所以这里还是先介绍怎么在手机上体验 https://i-blog.csdnimg.cn/blog_migrate/00b9c17e6316dc682bcbd5967ec644d0.gif

目前最简单的方法就是 @ag2s20150909 制作的这款小APP了

APP的最新版发布在作者的Github:

https://i-blog.csdnimg.cn/blog_migrate/070fa2de2a10fae23cb73e11ccbe37cc.png

如果你访问Github困难,建议了解

将APP下载并安装好之后,点击左上角「设置TTS」,将手机的默认的文字转语音引擎改成「TTS」

https://i-blog.csdnimg.cn/blog_migrate/4d97c0e9441c43f3e838f32c4aa9f680.png

然后回到APP内,默认的AI是晓晓,如果你要切换成其他AI, 要先勾选「自定义」,然后再点击切换! https://i-blog.csdnimg.cn/blog_migrate/510f5503f54e5a40e351e889054d59b2.png

阿虚自己是比较喜欢 云希 这个AI 的声音, 讲话风格 你也可以自行选择(有新闻/客服/助手/闲聊等等),阿虚自己是用的默认

https://i-blog.csdnimg.cn/blog_migrate/69d1a53a8154d7a79cdeaac80f1d9df6.png

然后因为TTS是系统级的功能,基本上的电子书阅读器都是支持调用系统TTS来朗读的 https://i-blog.csdnimg.cn/blog_migrate/4ab7d7e236dd4f86709f7c9cb22d2175.png

你立马就能在你常用的 阅读、静读天下 这类APP上体验到微软TTS的牛逼了!

https://i-blog.csdnimg.cn/blog_migrate/3990f4435f9f1bdecdfefc15035e1adc.png

不过这个TTS据悉会时不时存在卡顿、跳读问题,网友们给出的解决方法有以下这些:

  1. 换格式
  2. 换AI发声人
  3. 换时端

换格式的意思是,在TTS右上角的设置中,更改音频流的格式

说白了就是降低音频质量,32kbit/64kbit/128kbit 这些总能明白吧 https://i-blog.csdnimg.cn/blog_migrate/e4f068bcc712a094369ab8be38b92031.gif

理论上来说如果是网络问题导致的朗读卡顿,降低音频质量就应该是能明显改善问题的

https://i-blog.csdnimg.cn/blog_migrate/7dd16568fe3f2d096ac01a879f35af31.png

而会出现以上问题的原因,大抵是因为大家用的都是作者的 API 导致的 (或者是作者从某处挖来的) ,公共服务的缺点自然是用的人越多越不好用…

如果你想要长期稳定可用的微软TTS服务,还是建议各位用大声朗读这款APP https://i-blog.csdnimg.cn/blog_migrate/f0e34fe2de28a8c5688af6668ad87e0d.png

不过使用这款APP的前提是你得满足这俩条件之一: 有国外的 edu 邮箱 或者 有VISA、MasterCard这类双币卡

但其实没有也有办法,你也可以借助万能的淘宝 https://i-blog.csdnimg.cn/blog_migrate/e4f068bcc712a094369ab8be38b92031.gif

现在还是能找到很多 edu 邮箱的卖家的,不过请注意: 不是所有的 edu 邮箱都能订阅 Azure ⚠️,买之前请自己详询卖家!

https://i-blog.csdnimg.cn/blog_migrate/07e8a380536752ea352d5cd8d4a0c110.png

或者你也可以选择淘宝找一家虚拟信用卡用于过 Azure 的支付验证(后续使用并不会扣费)

https://i-blog.csdnimg.cn/blog_migrate/223e8b787b7ceca91c725516c0f24c9c.png

总之若你满足以上条件,你就能自行注册微软 Azure 服务,然后借用大声朗读这款APP,从而获取到 长期稳定可用的微软TTS服务啦! https://i-blog.csdnimg.cn/blog_migrate/f7dfd70c912004ee62f1f6234421aadb.png

这个APP是由酷安大佬 @I I I I I 开发的: (可用酷安打开此链接,此链接为作者ID地址)

不过由于他现在已经隐藏了之前的动态,我没找到他原始发布的动态,

APP现在已经支持自动更新了,后续也不担心找不到最新版这种问题了

https://i-blog.csdnimg.cn/blog_migrate/cb05275dc92277da8c4d6cba5287986f.png

有国外 edu邮箱的话,你可以直接搜「面相学生的Azure」,然后填学校邮箱注册就行了,不需要信用卡(前提是你的 edu邮箱支持过Azure订阅) https://i-blog.csdnimg.cn/blog_migrate/e1f8aab359c2fe1dd28f5d05d2683432.png

要国外 edu邮箱是因为,由于国人大量薅微软的羊毛,国内的 edu邮箱的优惠早被薅没了…

https://i-blog.csdnimg.cn/blog_migrate/47b041ca952385253669269aec12c6c2.png

下面阿虚只介绍下有双币卡的情况怎么注册并使用

你别担心: 双币卡只是用于过验证,并不会真的扣款,并且后续使用也并不会扣款 https://i-blog.csdnimg.cn/blog_migrate/8d20e50addf424f0720c5b3ca34995f0.png

第一步打开此地址:

类似于谷歌云,首次注册 Azure 账号即微软云,会免费给你提供12个月的热门服务,还有200美元的服务付费额度,不过我们后续会用到的AI语音服务是有免费版提供的,所以并不用担心1年之后就要收费了

https://i-blog.csdnimg.cn/blog_migrate/cc75c620620191f3d3866fd3c8da7cfe.png

在上方地址「点击免费开始使用」后登录你的微软账号,并填写相关账号信息+勾选协议+填写双币信用卡信息后

https://i-blog.csdnimg.cn/blog_migrate/20964501e7ddf119c60a3b87c84b7f58.png

耐心等待信用卡验证注册好账号后,打开此地址:

点击「已在使用Azure?立即免费试用此服务」 https://i-blog.csdnimg.cn/blog_migrate/5bd4928ad5df6b789c812a0236d16bf2.png

https://i-blog.csdnimg.cn/blog_migrate/1b7fe65f0226b75856815adc3044b523.png

在创建资源页面按下图方式进行,只需要注意 订阅Pricing tier 处都选择免费选项即可

然后点击底部的「审阅并创建」,等待审阅通过,继续点击一下「创建」

https://i-blog.csdnimg.cn/blog_migrate/222fd6e5a77f3429ca8ee84bb7284066.png

创建好之后,点击「转到资源」

https://i-blog.csdnimg.cn/blog_migrate/4b4377b549428567f2da190031c8d55a.png

点击管理密钥 https://i-blog.csdnimg.cn/blog_migrate/b204607dd3f21719be898ccd9d0dbdee.png

https://i-blog.csdnimg.cn/blog_migrate/a6f80335cbc348c207bcb7433a95f6ca.png

你会看到两个密钥,随便用一个就行

https://i-blog.csdnimg.cn/blog_migrate/1ce1c7666e1f314689c76b621a3a144e.png

把密钥填到大声朗读的APP里即可,然后点击「SSML语音合成标记语言」 https://i-blog.csdnimg.cn/blog_migrate/bdf2bf34d4d4115de503494ec3bd0053.png

https://i-blog.csdnimg.cn/blog_migrate/b4822ccec21f9ba6113092c02b152dcc.png

输入下方代码并保存,然后就可以随心使用了 ~

https://i-blog.csdnimg.cn/blog_migrate/7d58a13a1f3e723a52e8fe526935f1d9.png

关于这段代码,你可以按需调整这3部分:

  1. name=“zh-CN-YunxiNeural”,即阿虚上图使用的是Yunxi(云希)这款AI语音
  2. style=“assistant”,表示讲话风格设置的则是assistant(以热情而轻松的语气对数字助理讲话)
  3. styledegree=“2”,这个值可以指定说话风格的强度, 默认值为1,最小值0.01,最大值2
<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" 
xmlns:mstts="https://www.w3.org/2001/mstts" 
xml:lang="zh-CN">
  <voice name="zh-CN-YunxiNeural">
    <prosody rate="${(rate-100)?c}%" pitch="${(pitch-100)?c}%">
      <mstts:express-as style="assistant" styledegree="2">${text}
      </mstts:express-as>
    </prosody>
  </voice>
</speak>

如果你想要自行更换以上配置,你需要参考微软官方的文档:

你需要知道的是, 每个AI所拥有的 Style 风格是不一样的 ,比如 Yunyang 目前就只有 customerservice 这一种风格 https://i-blog.csdnimg.cn/blog_migrate/e1f8aab359c2fe1dd28f5d05d2683432.png

而 Yunye 则有calm、cheerful、sad、angry等等多种风格可选

https://i-blog.csdnimg.cn/blog_migrate/517f971a8bdea25ef12d7ee55da427c1.png

最后需要注意的是目前微软Azure的 免费额度是每月50万文本转语音字符 https://i-blog.csdnimg.cn/blog_migrate/8536567c6250244f0a664b1524b4f143.png

最新的免费额度见这里:

iOS上就没有像安卓端的TTS那样装上就能用的APP了

目前阿虚所知仅有「源阅读」这款APP支持自定义添加微软AI语音

具体来说就是必须自己去注册微软Azure账户申请Key才能使用,具体申请步骤就请自行参考本文1.2节了,在此阿虚便不再复述

但是这里有一点非常重要的步骤需要注意:目前iOS源阅读1.4.8版本还不能自定义TTS服务区域,导致目前想要用上的话,必须在最开始创建语音服务时选择 东亚地区(East Asia) ⚠️

就只有这一点需要注意,后续到是就没啥了

打开源阅读APP,找到设置 » 语音管理 » 创建云语音

https://i-blog.csdnimg.cn/blog_migrate/37a2e091962c524a77cc6daf89fba474.png

服务商选择Azure,语音名称随便输入,然后填入你自己的Key,发音人的设置方法依旧请参考本文1.2节

https://i-blog.csdnimg.cn/blog_migrate/f2761650724b5e1727f688f7ed4fffbf.png

随后就直接能在听书的时候选择并使用了

https://i-blog.csdnimg.cn/blog_migrate/c2b79a501fc6b53e11db84c6d39ed954.png

另外就是这款APP由于一些原因,在2022年1月的时候从AppStore的中国区下架了,目前想要下载这款APP,需要到国外区的AppStore下载

具体如何注册国外Apple ID,请自行参考我原来的这篇教程:

另外一个可行的方法就是之前写 iOS微信双开 时候提到的,花钱使用云手机了 https://i-blog.csdnimg.cn/blog_migrate/388f3990a09d7de148bd35656f5c6993.png

云手机是安卓系统 ,那你就只需要回头去参考本文第一节的内容就行了

https://i-blog.csdnimg.cn/blog_migrate/d0a10b57a86f989ea9f07e0ed66cdd3a.gif

另外如果你不是想用于听书,而是想将微软AI语音用于自媒体配音,相关软件、网站请

https://i-blog.csdnimg.cn/blog_migrate/f23c9e4bc9ab448a5b29e449a131b5ca.gif