galatea

音声対話技術の普及促進と進化

下記の場で連名で発表をした内容について、西本担当分の原稿をご紹介しておきます。 第78回 音声言語情報処理研究会 (SIG-SLP)(第5回 音声言語情報処理技術デベロッパーズフォーラム) 日時: 平成21年10月23日(金) (5) 階層的MMIアーキテクチャに基づくプラ…

音声によるインクリメンタル検索

擬人化エージェントの研究から派生したアイディアだが、ちょっと前に作って放置していたデモをビデオにしてみた。 西本 卓也 他: "探索的検索のための音声入力インタフェースの検討," 情報処理学会研究報告 2008-HCI-127(2), pp.9-14, Jan 2008. ビデオの作…

メーリングリストでの議論

先日、音声対話ツールキット(構成要素として音声認識、音声合成、顔画像合成などを含む)の公開パッケージを更新しました。 http://sourceforge.jp/projects/galatea/releases/ galatea-users および galatea-i18n の各MLの皆様にお知らせしたところ、さっ…

音声合成エンジンとライセンス

私のブログにさっそく匿名のコメントをいただきました: >再配布不可のUniDicを使ってるからオープンソースの意味ないです >お金払うなら高性能な他の有料合成エンジン使います どこかでこの件について書きたいと思っていました。私としては、こういう意見…

オープンソースと経済活動

擬人化音声対話エージェントツールキット Galatea Toolkit は、広く人間と機械の音声対話の技術を開発・普及するべく、以下の特長を持つ技術として開発されました。 人間の顔と表情を持ち、音声で対話するエージェントを作成できる 顔、声、音声合成テキスト…

音声対話技術講習会

高度言語情報融合フォーラム http://alagin.jp の主催による「音声認識・音声対話技術講習会」が先週京都大学で開催され、私は最終日(8月28日)の演習を担当しました。 京都工芸繊維大学の荒木先生が講義された内容をふまえて Galatea Dialog Studio による…

島根県CMSの技術

「島根県CMS」はRuby on Railsで作られたオープンソースソフトウェアの行政機関向けCMSです。このシステムの中で音声合成エンジン GalateaTalk がどのように使われているかを理解し、今後どのように改良のお手伝いをしていくべきなのか考えたいと思っていま…

checkinstall

最近、簡単に .deb パッケージを作るツールの存在を知りました。 さっそく galatea で使用しています。GalateaTalk で使っている言語処理系 /usr/local/istc をパッケージにする例です:準備 作業環境は Ubuntu Linux 8.10 $ sudo apt-get install checkinst…

リリースノートとチュートリアル

sourceforge.jp の galatea プロジェクトの wiki サイトに、3月に配付される予定の Galatea Toolkit リリースノートとチュートリアルの草稿を公開しています。 チュートリアルでは Ruby on Rails を使う具体的な例を掲載しました。 http://sourceforge.jp/pr…

テンプレートの階層

音声対話ツールキット Galatea のプロジェクトに関わり、マルチモーダル対話記述・アーキテクチャの標準化に関わり、Ruby on Rails による VoiceXML アプリケーションの実装について考えた末、「階層化されたシステムの実装は、テンプレートエンジンの階層に…

顔モデルのカスタマイズ

合成音声や顔画像合成のカスタマイズができるのが Galatea の特長のひとつなのですが、カスタマイズされたモジュールを連携させて制御するためには、対話統合処理においても設定が必要です。これらの設定を統一的に管理する枠組みは、残された課題のひとつに…

Julius の「デコーダに基づくVAD」

音声認識エンジン Julius 4.1 に関する記録。 http://julius.sourceforge.jp/ 「デコーダに基づく VAD は,デフォルトでは無効化されており,使用するにはコンパイル時に configure オプションで --enable-decoder-vad を指定し,実行時に -spsegmentを指定…

ERBとインスタンス変数

Rails の View のようなテンプレートエンジンを ERB 単体で使う例。 詳しい説明はあちこちで見かけたのですが私が確認したかったポイントに絞ってみました。 #!/usr/bin/ruby require 'erb' erb_doc = <<EOS hello world 1 <% 1.upto(3) do |i| -%> <%= @hoge %>:<%= i %> <% end -%> hello world 2 EOS</eos>…

オープンソースソフトウェアとWebアクセシビリティ

上記に関連して、次回WIT研究会/HI学会研究会の企画として、ITRC UAI(Universal Access to the Internet)研究会と共催の特別企画を行います。 研究会プログラム http://www.ieice.org/~wit/program/2008_12-no45.html 参加費は無料です テーマ:オープンソ…

音声インタフェースとWebアクセシビリティ

先日、下記の発表をしました。 西本 卓也: "音声インタフェースとWebアクセシビリティ," ヒューマンインタフェース学会第4回SIGACI研究談話会/第30回UAI研究会, 15th Nov 2008. 予稿 http://hil.t.u-tokyo.ac.jp/~nishi/2008/Nishimoto2008ACI11-paper.pdf …

Galatea Dialog Studio の開発状況

いろいろなマシンで作業する必要がでてきたので、懸案だった sourceforge.jp の CVS リポジトリへの移行をしたいと思い、Eclipse で行っている作業ファイル一式を下記にインポートしました。Galatea Dialog Studio 2.2.3 に向けた作業中です。 http://cvs.so…

Remastering Knoppix 5.3.1 ja

Knoppix 版 Galatea Toolkit の開発にむけて調査を進めています。下記の資料が大変参考になりました。 http://www.ntt.co.jp/qos/tools/KNOPPIX-Customization.pdf この資料にしたがって、USB接続HDDを ext2 でフォーマットして作業領域にしています。 しか…

Galatea for Linux の今後

これまでISTCの活動としてGalatea Dialog Studioの開発を続けてきたのですが、来年度以降、完全にボランティアベースの開発になる可能性もあるので、最近の統合作業と技術調査、および先日の講習会での反応を踏まえて、特に Galatea for Linux のシステム全…

技術サバイバル論

昨日FIT2008にてW3C関連のイベント企画「ユビキタスWeb―これからのWebのために必要な技術は何か―」のパネル討論「ユビキタスWeb実現にあたっての課題」に参加しました。日本でなぜ標準化は流行らないのか、というお題をいただいたのですが、私はこれを「よい…

Knoppix と Ubuntu

Galatea for Linux の動作検証のために、いつも使っている Vine Linux とは違うディストリビューションを使ってみました。USB メモリから起動する Knoppix 5.3.1 環境を作ったところ、Let's Note で 3D が有効になり FSM が 24fps くらいで動作しました。Gal…

VoiceXMLとRuby on Rails 続編

3月にVoiceXMLとRuby on Railsという記事を書きましたが、Ruby on Rails 2.0.2 で作り直してみました。 # routes.rb に追加 -> http://localhost:3000/weather/state1.vxml map.connect ':controller/:action.:format' # 001_create_region.rb class CreateR…

GalateaTalk と ISTC の今後

ISTC総会では音声認識、音声合成、顔画像合成の各グループの成果報告と次年度の目標なども伺いました。ISTCは情報処理学会の下で活動してきましたが、現在の計画では2008年度が最終年度となっています。 私は Galatea Dialog Studio に加えて Linux 版の統合…

VoiceXMLとRuby on Rails

先日、音声対話技術コンソーシアム(ISTC)総会で、Galatea Dialog Studioについて御報告をして、表題の件についてこんなデモをお見せしました。 # voice_controller.rb class VoiceController < ApplicationController def state1 # counter をセッションで記…

島根県CMS

2002年に、ラジオフライでは音声合成を用いたインターネットラジオ番組「ラジオフライマガジン」の制作を行いました。ラジオフライのメーリングリストでのやりとりが、編集の達人・デーブ川崎氏によって、月刊ウェブマガジンとしてまず公開されました。それ…

Galatea Dialog Studio

オープンソースのVoiceXMLインタプリタGalatea Dialog Studioの新しいバージョンをリリースしました。 http://hil.t.u-tokyo.ac.jp/~nishi/galatea-doc/main.html https://sourceforge.jp/projects/galatea/files/?release_id=29395 Galatea Toolkitは2000〜…