UnityXWhisper240913 | E-152教室

導入
自動車の中でAIと会話する未来は「ほぼ確定」だと思う。いろいろ便利だし，気晴らしになるし，運転中一人で寂しいし・・・。OS標準の音声認識はいろいろボタンを押さなければならず，運転中の操作には問題がある。googleSTT（SpeechToText）やWhisperを使えば，ハンズフリーで会話ができるはずだ（OpenAIアプリのように）。PCアプリであっても，キー操作が必要なくなればより没入感というか，人と話してる感が高まるのではないか？
Whisper対応を強化
すでにUnityから利用可能なように知見を貯めていたが，ハンズフリーを目指して大幅介入だ。以前のバージョンはRecordを押して喋りStopを押すと変換されたが，これは２度もボタンを押さねばならん（しかも違うボタン）。次はRecordを押すと録音が始まり離すと変換される形式。最終的には音圧をチェックし，しきい値を超えたら録音開始，下回ったら停止して変換。これなら連続して変換が可能だ。画像じゃわからないので，動作の様子を録画しようと思う。明日にでも・・・。

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル