表情模倣しながらAIと話す

プロジェクトはWindowsネイティブアプリ用に
WebGLアプリはUDPで表情認識AIの情報受け取れないし・・・一体どうしたらよいのか。結局，WebGL版の模擬人格プロジェクトをコピーして，Windowsネイティブアプリにしてビルドしてみたら，意外に良い感じで動いたので，こちらで行くことにしました。プロジェクトの名前はNative6です。ビルドターゲットのスイッチは7分弱かかって，頻繁に行うのは現実的じゃないです。
表情データの送信方式
遅きに失した感もありますが，オープンCVで認識した感情データをudpで送る部分はすでにできていたので，後はAIの情報を受け取るプログラムをGPT4oに作成してもらい，そこから感情情報を抜き出し，コミュニケーションに加味できるように，調整してみました。
実際に動かしてみて
感想としては，感情認識のタイミングがOpenAIへの問い合わせ依存なので，ややテンポが遅いようにも感じる。しかし現実のコミュニケーションも案外こんなもんかもしれない。
1.リアルタイムで感情模倣が起こることが大切なのか
2.GPT4oにこちらの感情状態が伝わることが大切なのか
どちらにしても表情を合わせてくれるので，これらの要因が実際のコミュニケーションでどんな風に機能するのかまだよくわからない。生きた人間のコミュニケーションでは，相手の（時として細やかな）表情を瞬時に読み取り，相手の意図や，コミュニケーション内容の真偽を直感的に評定していたりする。こういったコミュニケーションがAIエージェントに果たして可能なのか，そもそも必要なのか，研究はまだ始まったばかりだから分からないことだらけだ。

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

E-152教室

表情模倣しながらAIと話す

コメントを残すコメントをキャンセル

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル