1: 2018/06/08(金) 16:54:20.37 ID:CAP_USER9
みなさんは自分の声そっくりにしゃべる合成音声をお持ちだろうか? 
筆者は2年4カ月前から自分の声「松尾P」を使えるようになっていて、たまに記事で使っている。ちょっとした自慢だ。
ところがこの先行者特権が失われようとしている。
4月17日に東芝デジタルソリューションズが公開したモバイルアプリ「コエステーション」が原因だ。
自分の観測範囲でもかなりの人が自分の合成音声「コエ」を持ち始めている。
コエステーションは、自分の声で10個の文を読み上げるだけで自分の声を基にした「コエ」ができて、TTS(Text to Speech)による発声をアプリ内でできる。しかも無料。
これはとんでもない価格破壊だ。

これがどのくらいの価格破壊かというと、既存の音声合成企業が提供しているカスタムボイス作成では40万円(AITalk Custom Voice)、36万円(ボイスター ライト版)と、簡単に手を出せる価格ではない。
筆者の声をモデル化した「松尾P」は、HMM(隠れマルコフモデル)を使った音声合成だ。
オープンソース版のTTSであるOpen JTalkと、それを商用化したCeVIOがこの技術に基づいている。
CeVIOはTTSだけでなく、歌唱合成もできて、故・三波春夫の歌声を合成することもできる。
歌声合成のオープンソース版はSinsyで、筆者の歌声(英語のみ)を合成して歌わせることもできる。

■HMMを使った音声合成Open JTalk

このOpen JTalkを元にしたWindowsアプリにSHABERUというものがある。
無料で様々な音声を使ってしゃべらせることができるアプリだ。
作者のアキヒロさんはOpen JTalkで用いられているhtsvoice形式の音響モデル作成を無料で提供していて、筆者は自分で収録したサンプル文をアキヒロさんに送り、データベース化作業をアキヒロさんがやってくれたのだ。
通常、特定の声の音声合成モデルを作成するためには、音素の組み合わせを網羅したたくさんの文章を読み上げ、そこからモデル化する。
よく使われている例文はATR503音素バランス文というもの。
htsvoice構築にも通常はこの文章を用いる。アキヒロさんは独自のバランス文を用いて、200程度の文章で可能にしているが、それでもなかなかの作業だ。
htsvoiceの作成にはLinuxと様々なツールをインストールし、そのシステム構築は大変だ。
やり方を自分でも模索してみたが、独力でできる気はまったくしない。

■コエステーションはいきなりできたわけではない

そしてコエステーションである。
なぜいきなり東芝子会社がこんな技術をと思うかもしれないが、東芝は音声合成で長い歴史を持つ老舗なのだ。
2001年に終了してしまったLaLaVoiceというTTSのパッケージソフトを持ち、dynabook(当時はDynaBook)にバンドルしていた。
LaLaVoiceには簡易的な歌声合成機能もあり、登場時期はVOCALOIDよりも早かった。

LaLaVoiceが終了した後で登場したToSpeakは現在、東芝デジタルソリューションズのクラウドAIであるRECAIUSで使われている音声合成エンジンと位置付けられている。
人に似せた声でしゃべるカスタムボイス機能は実証済みだ。
2016年に人気パーソナリティーである小林克也さんが録音した数時間分の音声から作り出された合成音声「コバカツ君」がそれだ。
このときはRECAIUS音声合成ソフトサービスとして紹介されている。
さすがスネークマンだけあって日本語だけでなく英語も流暢にしゃべり、歌もうたう。

■小林克也さんの声から作り上げた「コバカツ君」はFM NACK5の放送でも使われた

コエステーションはこうした手間のかかるカスタマイズをiOSアプリでやってしまうというところが画期的だ。
iPhoneかiPadと付属のEarPodsイヤフォンがあれば、自分の声に似た合成音声を作り、実際に使うことができる。
それも最初は10の文を読み上げるだけでよい。

Open JTalkの場合は503、少なくとも200以上の文を安定した状態で読み上げる必要があった。
しかもその処理には複数のアプリを組み合わせたLinuxをぶんまわす必要がある。
コエステーションはiOSアプリの中で読み上げると1文ずつサーバに送られる。
10文を読み上げると第1段階「コエレベル1」クリアだ。

コエレベルは最高で5。コエレベル1は10文、レベル2は50文、レベル3は100文、レベル4は150文。
筆者は200文を読み上げ、最終段階のレベル5に到達している。
ここまでくると、品質はかなり高く、少し荒削りなところもあるOpen JTalkより柔和で本人に近く聞こえるようだ。

動画 https://youtu.be/0g06LxUIZ4E



http://www.itmedia.co.jp/news/articles/1806/08/news104.html

38: 2018/06/08(金) 17:14:12.47 ID:DpZ7tKum0
>>1
オレオレ詐欺の精度があがるな

46: 2018/06/08(金) 17:38:57.40 ID:X67wXzHu0
>>1
自分の声にエロ小説を読ませて楽しいだろうか

97: 2018/06/08(金) 19:35:23.02 ID:HLY3/GHZ0
>>1
ショーン君でいいや

120: 2018/06/10(日) 09:34:55.92 ID:gmVlI+JF0
>>1
音声認証側もアップデートしないとな

2: 2018/06/08(金) 16:54:50.91 ID:3LWynXOf0
これはあかん

3: 2018/06/08(金) 16:55:42.72 ID:QPlUgAkB0
音声セキュリティ終わったな

4: 2018/06/08(金) 16:56:12.51 ID:H/vHSRWH0
俺の声は美輪明宏似

5: 2018/06/08(金) 16:56:42.31 ID:KPukoTu+0
バーチャン オレオレ

7: 2018/06/08(金) 16:57:23.13 ID:WV1FMeQI0
オレオレ

8: 2018/06/08(金) 16:57:45.17 ID:6aFrrbr80
せやかて工藤!!

9: 2018/06/08(金) 16:58:16.13 ID:+mzWFija0
ということは、俺の声で
あんなエロい言葉や、こんなエロい言葉を
喋らせられるのか!!
しかも無料で!

30: 2018/06/08(金) 17:07:36.24 ID:LxL+MV670
>>9
全くありがたく無いようだがすごく新鮮かもしれないなw

10: 2018/06/08(金) 16:59:10.54 ID:kX7Dzhkg0
これでもうどもらなくてすむな

11: 2018/06/08(金) 16:59:52.28 ID:Cvp9qmbJ0
官僚の声で「おっぱい」と言わせればセクハラで仕留められるし、
脅迫やら犯罪に色々使われて

音声録音が証拠として意味を持たなくなっていくんだろうな……

12: 2018/06/08(金) 17:00:33.10 ID:VT2mgIld0
自分の声を聴いた時のショックは忘れない

14: 2018/06/08(金) 17:01:34.56 ID:DMZ3aqUZO
これで好きな声優の音声で朗読出来る?
小山力也風で老人と海を聴きたい

16: 2018/06/08(金) 17:02:06.89 ID:vgXxzRzQ0
東芝は無料にして、何で利益を上げるんだろ

42: 2018/06/08(金) 17:28:33.59 ID:kPcbqWQb0
>>16
有料で利益を上げられないなら、無料にする事で活路を見いだす事も出来る
利用は無料なのに収益を上げている企業はいくつか想像出来るだろ?
ただ、シェアを奪えないと意味が無いけれどね

81: 2018/06/08(金) 18:41:31.17 ID:Ko21KCRF0
>>16
声紋データじゃないの?

107: 2018/06/08(金) 20:18:14.77 ID:YCA/AhWH0
>>16
多数のデータサンプリングをもとにさらにブラッシュアップするんじゃないの

17: 2018/06/08(金) 17:02:08.37 ID:xUSDNUyR0
PC用なら今でも無料ソフトあるじゃん

18: 2018/06/08(金) 17:02:18.30 ID:yNX+EWU90
いや、自分の声が欲しいわけじゃないんだが。

109: 2018/06/08(金) 20:23:19.15 ID:rslJejaQ0
>>18
女の子が自分の音声を100円くらいで売る、おっさんがそれを買う。
こんな図式が浮かんだ。

再生するためのアプリを月額500円くらいのサブスクリプション契約にしたら安定した収入になりそうだ。

19: 2018/06/08(金) 17:03:25.59 ID:6aFrrbr80
つんくは喜ぶだろう

20: 2018/06/08(金) 17:03:46.73 ID:sjtqaBf30
声優業廃業か

21: 2018/06/08(金) 17:04:30.34 ID:8F6gkyY40
普通の人は声の訓練なんてしないからな。
ユーチューバーにすらなれない

22: 2018/06/08(金) 17:05:12.18 ID:6aFrrbr80
アニメ声優は無価値かもねw

音響監督と一晩寝るだけの仕事になるw

23: 2018/06/08(金) 17:05:25.31 ID:OSrXvX0a0
皆口裕子の声で問い詰められたいわ。

24: 2018/06/08(金) 17:05:49.65 ID:Cvp9qmbJ0
リンク先を見たけど
まだまだのレベルだった。

25: 2018/06/08(金) 17:06:01.51 ID:28cMyJ9/0
クレーマー対策にうってつけだな

26: 2018/06/08(金) 17:06:04.62 ID:645X76Qq0
ゲームの主人公がプレーヤーの声で喋るとか

エロゲにしか需要なさそうだけど

27: 2018/06/08(金) 17:06:21.31 ID:YqaWTJky0
AIが声優の本業を奪うのも近いのか

28: 2018/06/08(金) 17:07:08.34 ID:FQkRX52T0
iPhoneしかなかった

29: 2018/06/08(金) 17:07:16.99 ID:cPlVmK980
音声認証オワタという事?

31: 2018/06/08(金) 17:07:59.09 ID:LE4bZn0m0
オレオレ詐欺にバカ売れ?

32: 2018/06/08(金) 17:08:19.47 ID:6aFrrbr80
女性の声は、あきらかに抜けてる周波数があるけどね

まあ男性の声より女性、子供の声のほうが難しいだろうね

33: 2018/06/08(金) 17:08:43.69 ID:9ocveysh0
Android版ないのかiPhoneとか誰も使わないだろ

34: 2018/06/08(金) 17:10:01.47 ID:k/ZzDrkp0
動画見たけどレベル5を聞かせろよ

39: 2018/06/08(金) 17:15:19.04 ID:6aFrrbr80
>>34
レベル5は「手仕事」なんじゃないかなw

35: 2018/06/08(金) 17:10:04.62 ID:oa990DQS0
スケットダンスのスイッチできるやん

40: 2018/06/08(金) 17:17:57.44 ID:ezG/5GGl0
声を盗まれるぞ

43: 2018/06/08(金) 17:31:10.40 ID:6aFrrbr80
「死にたくなければ、読め」

47: 2018/06/08(金) 17:41:18.89 ID:A5C9uz3u0
コレにミクの音声で喋らせたらどうなる?

48: 2018/06/08(金) 17:45:53.13 ID:9HnvCGte0
ここはやはり峰不二子の声使ってあんなことやこんなこと

49: 2018/06/08(金) 17:46:52.87 ID:P5fy50bb0
i-osのみって舐めとんのか!!

55: 2018/06/08(金) 17:56:40.11 ID:X67wXzHu0
>>49
あーなるほど
これで、OK,Googleと言わせたらロック解除できちゃいますわ

51: 2018/06/08(金) 17:51:03.29 ID:7wlUWBoH0
なりすましヤバくね?

52: 2018/06/08(金) 17:51:06.68 ID:EbiRvkl00
人に与える印象は声そのものよりしゃべり方の方がよっぽど重要

54: 2018/06/08(金) 17:54:28.74 ID:57ryy15w0
声の綺麗さでいえば、セビオが一番

57: 2018/06/08(金) 17:59:51.81 ID:hwDF+wyc0
>>54
スポーツ量販店?

56: 2018/06/08(金) 17:59:30.72 ID:CNPv59XJ0
犯人「よっしゃこれで暴言してもセーフになるわ。どんどんDIS言うたろ」

58: 2018/06/08(金) 18:00:04.30 ID:DRAjs9zV0
振り込め詐欺を助長させてどーすんのさ

63: 2018/06/08(金) 18:07:10.99 ID:40ESlBFg0
>>58
だよねぇ
俺も思った
でも音声データを登録出来ないだろうから関係ないか

59: 2018/06/08(金) 18:00:08.85 ID:qPkgOZ9a0
詐欺に利用されませんかね

引用元: http://asahi.5ch.net/test/read.cgi/newsplus/1528444460/