[Go to English page]
Hideki Kawahara, Emeritus Professor, Wakayama University (サーバ移行に伴う更新作業中)
Updated: Mon Mar 4 03:02:47 JST 2024
-
STRAIGHTの機能の全てをWORLDに移行します。コードと資料はGitHubで公開しています。以下の資料を参考にして下さい。
worldGUItools.
-
Kawahara, H., & Morise, M. (2024). Interactive tools for making vocoder-based signal processing accessible: Flexible manipulation of speech attributes for explorational research and education.
Acoustical Science and Technology, 45(1), 48–51. (DOI: 10.1250/ast.e23.52)
(Link to PDF)
音声、知能、計算機、SF、音楽、数学。趣味として、仕事として、
あるいは単なる知的好奇心から関わってきた一見すると脈絡の無い項目。
科学技術の進歩とネットワークの急速な発展は、これらを
「聴覚メディア処理の研究」という
ライフワークとして追求することを可能にしました。
技術に人間を合わせるのではなく、人間に合わせて技術を開発することは今や急務です。
「人間のための聴覚メディア処理」には、迂遠には見えても、
聴覚?音声の発達?進化をリバースエンジニアリングして本質を理解することが必須です。
実際、この戦略は、画期的な音声処理技術STRAIGHTを生み、それが新たな聴覚の本質の発見と検証に結びついて来ました。
2015-2016の英国Googleでの研究は、それらを実世界に還元するための大きな一歩となりました。
これからも、世界中の志を同じくする仲間達とともに、
「人間のための聴覚メディア処理」を確かな技術として普及?定着させることを使命として、
研究と広義の教育に携わっていきます。
-
2022年1月からのIEEE Fellowに昇格しました。(Nov. 2021).
- ISCAの旗艦国際会議Interspeech2021で、CAPRICEPを応用した二件の発表を行いました:(6-11, June, 2021)
- Kawahara, H., Matsui, T., Yatabe, K., Sakakibara, K.-I., Tsuzaki, M., Morise, M., Irino, T. (2021) Mixture of Orthogonal Sequences Made from Extended Time-Stretched Pulses Enables Measurement of Involuntary Voice Fundamental Frequency Response to Pitch Perturbation. Proc. Interspeech 2021, 3206-3210,
(doi: 10.21437/Interspeech.2021-2073)
-
Kawahara, H., Yatabe, K., Sakakibara, K.-I., Mizumachi, M., Morise, M., Banno, H., Irino, T. (2021) Interactive and Real-Time Acoustic Measurement Tools for Speech Data Acquisition and Presentation: Application of an Extended Member of Time Stretched Pulses. Show and Tell in Proc. Interspeech 2021, 4853-4854
(Archive with a link to PDF)
- IEEEの旗艦国際会議ICASSP2021で、FVNの上位互換の概念CAPRICEPとそれに基づく測定法を発表しました: (6-11, June, 2021)
H. Kawahara and K. Yatabe, "Cascaded All-Pass Filters with Randomized Center Frequencies and Phase Polarity for Acoustic and Speech Measurement and Data Augmentation," ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2021, pp. 306-310,
(doi: 10.1109/ICASSP39728.2021.9415057.)
- ニュージーランドのオークランドで開催された国際会議APSIPA2020新しいシステム計測法を発表しました: (7-10,Dec.,2020)
Kawahara, Hideki, Ken-Ichi Sakakibara, Mitsunori Mizumachi, Masanori Morise, and Hideki Banno. "Simultaneous measurement of time-invariant linear and nonlinear, and random and extra responses using frequency domain variant of velvet noise." Proc. APSIPA ASC 2020, 174-183.
(PDF)
- 研究会資料(河原、榊原、水町、森勢、坂野:周波数領域ベルベットノイズを用いた音響計測の拡張,
電子情報通信学会技術研究報告(応用音響),EA2020-7,pp.35–42,2020.)が公開されました。
(PDF:誤りを訂正したPDF) (20/July/2020)
- 日本音響学会誌2020年6月号の小特集に、榊原、河原、水町で「利用価値の高い音声データの録音手順」を執筆しました。
- 日本音響学会誌2020年3月号の小特集に「インパルス応答の基本概念」を執筆しました。
- 招待講演の研究会資料(河原、Velvet noiseと周波数領域Velvet noise--偶然から生まれた奇妙な信号が音と聴覚の再考を促す--、
電子情 報通信学会技術研究報告(応用音響),EA2019-65,pp.69–74,2019.)が公開されました。
(PDF)(11, Dec., 2019)
- 中国の蘭州市で開催された国際会議APSIPA2019で以下の二件を発表しました: (18-21,Nov.,2019)
- Hideki Kawahara, Ken-Ichi Sakakibara, Eri Haneishi, Kaori Hagiwara,
"Real-time and Interactive Tools for Vocal Training Based on an Analytic Signal with a Cosine Series Envelope,"
Proceedings of APSIPA Annual Summit and Conference 2019, Lanzhou, China, pp.907-910, 18-21 November 2019.
(tentative link to arXiV)
- Hideki Kawahara, Ken-Ichi Sakakibara, Mitsunori Mizumachi, Hideki Banno, Masanori Morise, Toshio Irino,
"Frequency Domain Variant of Velvet Noise and Its Application to Acoustic Measurements,"
Proceedings of APSIPA Annual Summit and Conference 2019, Lanzhou, China, pp.1523-1532, 18-21 November 2019.
(tentative link to arXiV)
- オーストリアのGrazで開催されたInterspeech 2019で以下を発表しました:
Terasawa, H., Wakasa, K., Kawahara, H., Sakakibara, K. (2019)
Investigating the Physiological and Acoustic Contrasts Between Choral and Operatic Singing.
Proc. Interspeech 2019, 2025-2029, DOI: 10.21437/Interspeech.2019-1864.
(Link ISCA archive,) (15-19, Sept.,2019)
- 研究会資料(河原、榊原、水町:周波数領域 velvet noise を用いた音響計測手順の拡張について,
電子情報通信学会技術研究報告(応用音響),IEICE-119(115),pp.77–82,2019.)が公開されました。
(PDF)
GitHubに音響計測用のツール類を置きました。
(リンク)(11, July, 2019)
- 日本音響学会 の
功績賞を受賞しました。(24, May, 2019)
- オークランド大学でARC/IEEE SPS NZ seminar talkとして講演しました. (22, February, 2019)
(発表と関連資料)
- voice morphing の章を執筆したThe Oxford Handbook of Voice Perceptionが出版されました. (06, December, 2018)
(
出版社のページ)
- 周期性による干渉を排除したパワースペクトル推定法を、APSIPA ASC 2018, Hawaii 12-15, Novemberで発表しました。
(PDF)
- 周波数領域のvelvet noiseの変種を提案した論文をInterspeech 2018, india 2-6, Septで発表しました。
(PDF ISCA archive)
- 応用音響研究会でFVNの音響計測への応用を発表しました.書誌情報と資料へのリンクは以下です.
河原,森勢,水町;周波数領域velvet noiseとパワースペクトルの静的表現を用いた音響計測の可能性について,信学技報, vol. 118, no. 190, EA2018-42, pp. 89-96, 2018年8月
(PDFへのリンク)
資料の図の作成に用いたものを含むMATLAB scriptを公開しました.解凍してお試し下さい(MATLAB scriptのアーカイブへのリンク)(2018.8.25)
- 音声分析変換合成法STRAIGHT(17/July/2016最終更新:legacy-STRAIGHT)を
GitHubに公開しました。関連特許の権利は全て消失しており、
これまでのライセンス先からも公開の許可を頂いています。(2018.7.24)
- シンガポールのNUSで周波数領域のvelvet noiseの変種と周期信号のスペクトル包絡の新しい表現についてTalkし議論しました。
(資料1、 資料2)(2018.6.21)
- Interspeech 2018のサテライトSummer School on Speech Signal Processing (S4P) 2018 (9-11, Sept.) でInvited talkします。(2018.6.9)
- STRAIGHTを非調波正弦波駆動に拡張してカクテルパーティー効果研究の新しい方法を提案した論文が
Nature Communications, 9(1) に公開されました。(DOI:10.1038/s41467-018-04551-8) (2018.5.29)
- 音響学会誌に書いた「ディジタル信号処理の落とし穴」がオープンアクセスになりました。(PDFへのリンク)(2018.4.4)
(確認用の MATLABコードへのリンクを再掲しておきます。)
- velvet noiseとその変種の聴覚心理?生理研究への応用可能性について発表しました。(2018/3/4:那覇)
(デモページ:発表資料、MATLABコードなど)
- velvet noiseとその変種について SIGMUS-118 で発表しました (2018/2/20/ つくば)(デモページ:発表資料、MATLABコードなど)(ニコニコ生放送 情処チャンネルの1:53頃から)
- 1月の音声研究会の資料とMATLABコードを置きました。(2018.1.20)
以下は、リストからの抜粋です。簡単な紹介を添えてあります。
- H. Kawahara, Y. Agiomyrgiannakis, H. Zen, Using instantaneous frequency and aperiodicity detection to estimate F0 for high-quality speech synthesis, ISCA SSW9, Sept. 2016. (Link to arXiV)
(従来法を凌ぐ忠実度で、時間変化する基本周波数の軌跡を追跡できる方法です。また、非周期成分も、同時に推定されます。)
- Hideki Kawahara, Masanori Morise, Hideki Banno, and Verena G. Skuk:
Temporally variable multi-aspect N-way morphing based on interference-free speech representations,
Proc. APSIPA ASC 2013, Kaohsiung, Taiwan, OS.28-SLA.9, 2013. (31/Oct./2013)
(モーフィングがN人の場合に拡張されました。2009年よりも、遥かに見通しが良くなっています。)
- 情報?システムソサイエティ誌,19巻4号, pp.7--10の
ソサイエティ人図鑑にインタビュー記事が載りました。図鑑?に陳列?
- Hideki Kawahara, Masanori Morise, Ryuichi Nisimura and Toshio Irino:
An interference-free representation of group delay
for periodic signals,
Proc. APSIPA, 3-6 December, OS.17-SLA 8, 2012 Calfornia, USA. (4/Dec./2012)
(パワースペクトル、瞬時周波数に続いて、群遅延も繰返しに影響されない表現を求めました。ここでもFlanaganの式が鍵になっています。)
(この方法は不完全でした。正しい静的群遅延は、2014秋の音響学会でも詳しく紹介します。:2014.7.25)
- Hideki Kawahara, Masanori Morise, Ryuichi Nisimura, Toshio Irino:
Deviation measure of waveform symmetry and its
application to high-speed and temporally-fine F0
extraction for vocal sound texture manipulation,
Interspeech2012, 2012. (10/Sept./2012)
(シャウト等に含まれる高速な基本周波数の変動に追従できる方法を発明しました。ここで、ようやく一年前の瞬時周波数の新しい計算法が役立ちました。)
- Hideki Kawahara and Masanori Morise,
Technical foundations of TANDEM-STRAIGHT, a speech analysis, modification and synthesis framework,
SADHANA - Academy Proceedings in Engineering Sciences, Vol.36, Part 5, pp.713-722, 2011.
(PDF)
(TANDEM-STRAIGHTのスペクトルの計算法の技術的背景をまとめてあります。オープンアクセスの資料です。)
- Hideki Kawahara, Toshio Irino and Masanori Morise,
An interference-free representation of instantaneous frequency of periodic signals and its application to F0 extraction,
Proc. ICASSP 2011, May 2011. (doi:10.1109/ICASSP.2011.5947584 )
(隣接する調波の影響を受けない瞬時周波数計算法を発明しました。1966年のFlanaganの式に、非常に面白い性質がありました。)
- 河原 英紀:音声分析合成技術の動向、日本音響学会誌、Vol.67, No.1, pp.40-45 (2011).
(日本語によるTANDEM-STRAIGHTとモーフィングの解説。2007年の解説と同様に、この執筆の後に新しい瞬時周波数計算法を
発明したことにより、また、最新情報ではなくなってしまいました。上記参照。)
- Kawahara, H.; Nisimura, R.; Irino, T.; Morise, M.; Takahashi, T.; Banno, H.; , "Temporally variable multi-aspect auditory morphing enabling extrapolation without objective and perceptual breakdown," Acoustics, Speech and Signal Processing, 2009. ICASSP 2009. IEEE International Conference on , vol., no., pp.3905-3908, 19-24 April 2009
(doi: 10.1109/ICASSP.2009.4960481)
(時間軸を含む様々な属性のモーフィング率を、時間の関数として設定することを可能にするモーフィングを定式化しました。)
- Stefan R. Schweinberger, Christoph Casper, Nadine Hauthal, Juergen M. Kaufmann, Hideki Kawahara, Nadine Kloth, David M.C. Robertson, Adrian P. Simpson and Romi Zaeske,
Auditory Adaptation in Voice Perception, Current Biology 18, 684-688, May 6, (2008).
(聴覚における高次属性の残効の存在を初めて明らかにした論文です。STRAIGHTによるモーフィングの、効果的な利用法の一例です。)
- Kawahara, H.; Morise, M.; Takahashi, T.; Nisimura, R.; Irino, T.; Banno, H.; , "Tandem-STRAIGHT: A temporally stable power spectral representation for periodic signals and applications to interference-free spectrum, F0, and aperiodicity estimation," Acoustics, Speech and Signal Processing, 2008. ICASSP 2008. IEEE International Conference on , vol., no., pp.3933-3936, March 31 2008-April 4 2008
(STRAIGHTのアルゴリズムを根本から定式化し直しました。計算量が大きく削減され、理論的な見通しも良くなりました。)
- 河原英紀:Vocoderのもう一つの可能性を探る--音声分析変換合成システムSTRAIGHTの背景と展開--,
日本音響学会誌,Vol.63,No.8,pp.442-449 (2007). [解説]
(日本語によるSTRAIGHTの解説。ただし、この執筆の後に新しいSTRAIGHTスペクトル推定法を
発明したことにより、最新情報ではなくなってしまいました。上記参照。)
- Hideki Kawahara: STRAIGHT, Exploration of the other aspect of VOCODER:
Perceptually isomorphic decomposition of speech sounds,
Acoustic Science and Technology, Vol.27, No.6, (2006).[招待論文]
(STRAIGHTの最新の情報をまとめた資料。
学会のWebから資料をダウンロードできます。
Acoustic Science and Technology のページ(PDF))
- David R. R. Smith, Roy D. Patterson, Richard Turner, Hideki Kawahara and Toshio Irino,
The processing and perception of size information in speech sounds,
Journal of the Acoustical Society of America, Vol.117, Issue 1, pp.305-318, 2005.
(聴覚には話者のサイズの情報を抽出する機能があることを明らかにした論文。
STRAIGHTがこの機能の発見のきっかけとなり検証の手段として用いられた。
この発見は、入野とPattersonによる聴覚初期過程の計算理論を補強する。)
- Hideki Kawahara and Hisami Matsui: Auditory Morphing based on
an Elastic Perceptual Distance Metric in an Interference-free
Time-frequency Representation, Proc. ICASSP'2003, vol.I, pp.256-259,
2003.
(STRAIGHTに基づく音声モーフィング手法を提案した国際会議資料。
感情音声の研究への応用は、同年のEUROSPEECHで発表。
この手法は、 様々な研究機関で利用されはじめています。
STRAIGHT を用いた感情モーフィングのデモ(Flashムービー)
(説明)
[demo英文]
)
- Hideki Kawahara, Ikuyo Masuda-Katsuse and Alain de Cheveigne:
Restructuring speech representations using a pitch-adaptive time-frequency
smoothing and an instantaneous-frequency-based F0 extraction:
Possible role of a reptitive structure in sounds, Speech Communication,
27, pp.187-207 (1999).
(STRAIGHTの最初の版とその背景となる思想を提案した論文。本論文は,EURASIPの最優秀論文賞を受賞)
- APSIPA ASC 2017 で、非周期性の混合指標を利用した駆動音源情報抽出を発表しました,
(Kuala Lumpur, 12-15, December 2017)
- ICOT 2017 で、SparkNGの音楽療法の学生支援への応用について発表ました。
(NUS Singapore, 8-10, Decemter 2017)
- シンガポールのNUSで開催されたIALPで基調講演を行いました (5-7, December 2017)
- Interspeech 2017で、Antialiased Fujisaki-Ljungqvist modelと、6項の余弦級数窓に基づく音源分析法を発表しました。それぞれ補足情報を加えた版をarXivに置きました。
(Fujisaki-Ljungqvist model: arXiv:1702.06724 [cs.SD]),
(音源分析法: arXiv:1706.02964 [cs.SD])
- 日本音響学会誌2017年9月号 小特集記事「ディジタル信号処理の落とし穴」の図の作成に用いたMATLABコードとデータを
リンクしました。(03/Sept./2017)
- 札幌の研究会(7/20)の資料が発行されたので、
リンクしました。
以下は書誌情報です。
河原英紀:[招待講演]VOCODER再訪 ~ なぜ元の音声の位相を保存したくないのか ~, 信学技報, vol. 117, no. 138, EA2017-4, pp. 21-26, 2017年7月.
- 日本音響学会誌2017年9月号の小特集に「ディジタル信号処理の落とし穴」を執筆しました。
- Interspeech 2017で、[非周期性と基本周波数推定の新しい方法]と、
[Antialiased Fujisaki-Ljungqvist model]を発表します。(20-24/Aug./2017)
- YANGvocoderにも使うことができる非周期性と基本周波数推定の新しい方法を、2/27-28の第114回
音楽情報科学研究会で発表しました。
- Google UK滞在時に開発したYANGvocoderが公開されました。(11/Jan./2017)
legacy-STRAIGHT, TANDEM-STRAIGHT, WORLDのようなチューニングはまだです。オープンソースです。
- APSIPA DL Talkの一環として
天津大学で発表しました。(09/Dec./2016)
- 名工大での講演資料を.PDFにしました。(10/Aug./2016)
- Google UKでの成果の一部(YANGsaf)を、Interspeech 2016併設の
ISCA Speech Synthesis Workshop (13-15, Spet. 2016) で発表しました。
基本周波数の時間変動を忠実に追跡できます。
資料をarXiVで公開 しています。
- APSILA DL talkの一環として 英国UCL (University College London)で講演しました。 (16/May/2016)
(PDF)
- APSIPA DL talkの一環として
Edinburgh University大(英)で講演しました。(29/Jan./2016) (PDF)
写真
- APSIPA DL Talkの一環として
台湾の中央研究院で発表しました。(22/Dec./2015)
- Anti-aliased L-F modelの詳細と応用について、
香港で開催されるAPSIPA 2015で発表しました。
(19/Dec./2015)
- APSIPA DL Talkの一環として
Sheffield大(英)で発表しました。(2/Dec./2015)
- APSIPA DL Talkの一環としてスタンフォード大のCCRMAで発表しました。
(PDF)(20/Nov./2015)
- 第109回情報処理学会音楽情報科学研究会の特別企画
「これからの歌声合成」でパネリストとして登壇しました。
ライブ中継(11/8 13:00-15:00、ニコ生の情報処理学会チャンネル)のアーカイブがあります。
(発表資料PDF )
- 8/10/2015より、Google in London
の
visiting research scientist として音声処理関係の研究をしています。
- エリアシングを回避したLF modelを用いて拡張した、声道形状ツールを8/3の研究会で紹介しました。
- 声道形状と、伝達特性、極周波数および帯域幅、LSF (LSP)と音声の対応を対話的に調べることのできるツールを、
Matlab realtime speech toolsに追加しました。Matlabに依存しないMac用とWindows用のアプリケーションも
用意しました。(26/May/2015)
-
Matlab realtime speech toolsについての説明資料が
APSIPA NewsletterのIssue 9
(pp.5-10)に掲載されました。オープンアクセスですので、自由にダウンロードできます。(20/April/2015)
- World Voice Day at Showa のために作成した、声道形状から音声合成するツールを
Matlabによるrealtime speech tools に追加しました。(18/April/2015)
- 和歌山大学での最終講義:「声?音?計算」2015年3月20日 15:00?17:00
(いろいろなネタを仕込もうとしています。題名もそうですが、仕込みすぎて自爆?23年前から成長していないことを発見?)
(発表のPDF:62MB。発表では、
DVDムービーと、Matlabによるライブでのデモを多用しました。最後のページに、会場で流していた
PENTATONIXとThe Real GroupのPVへのリンクを載せてあります。)
- 石垣島での音声研究会での発表資料 (2015.3.3)
- APSIPA
の2015-2016 Distinguished Lecturerに選出されました。アジア?環太平洋地区の教育研究機関を訪ねて、聴覚?音声研究のための信号処理の基礎やSTRAIGHTと時変多属性任意事例数モーフィングを中心とした講演をすることになります。(2015.4-)
- 電子情報通信学会 情報?システムソサイエティ誌,の19巻4号, pp.7-10 (2015.2月号) ソサイエティ人図鑑に
インタビュー記事
が載りました。(図鑑に陳列?)
- アンコールワットで開催されたAPSPIA 2014で、
STRAIGHTのチュートリアルを行いました。(2014.12.9-12)。
発表に用いた資料のPDF版をリンクしました(36MB)
- イエナ大学(独)のSeminar Series of the DFG Research Unit Person Perception,での講演
"Making speech tangible" (PDF) をリンクしました. (November 13, 2014)
- 白浜で開催された音声研究会?聴覚研究会の共催研究会で、招待講演をしました。(2014.10.23-24).
- Interspeech2014で、静的群遅延について発表しました。 (
補足資料のページ。Matlabコード等。) (17/Sept./2014)
- 音学シンポジウム(参加案内へのリンク)で、
周期信号の群遅延の静的表現を紹介しました。(2014.5.24)
- 第102回音楽情報科学研究会で
グロウル系歌唱への実時間変換の枠組みについて発表しました。(2014.2.23)
(USTREAM Session5 50:00から)
(発表資料(PDF)とMatlabコード)
- APSIPA2013で、「時変多属性任意事例数モーフィング」を発表しました。(10/31/2013)
(プレゼンテーション PDF。)
- 音楽情報科学研究会第百回記念シンポジウム「歌声情報処理最前線!!!」で
新しいモーフィング技術の応用を紹介しました。(Ustream, 1:03:30から)
(01/Sept./2013)
- バンクーバーで開催されたICASSP 2013で、
新しい基本周波数抽出法を発表しました。(F0抽出の誤解について、注意を喚起しています). (30/May/2013)
- イエナ大学で開催されたPPRU-Workshop VII
で招待講演を行いました。(2013.4.26)
- 関西音声合同ゼミ@和歌山大学の特別講演で紹介した
iPad用のiBook(2012.3.17版)をリンクしました。(2012.7.28)
(Fourier変換のムービーと、作成用のMatlabプログラム
)
- エジンバラ大学で開催されたLISTA workshopで、
招待講演を行いました。(2012.5.3)
- 京都で開催された
ICASSP2012のスペシャルセッション
(SS-L9: Advances in singing-voice synthesis, transformation, and application)
で発表しました。
(プレゼンテーションの資料等をリンクしました (2012.4.6))
- 情報処理学会 音楽情報科学研究会 スペシャルセッション「歌声情報処理最前線!!」
で発表(
USTREAMへのリンク)
しました(2012.2.3)
用いた資料やムービを
「歌声情報処理最前線!!」歌声のテクスチャに信号処理はどう迫るか
のページにリンクしました。
- TANDEM-STRAIGHTの技術情報が、
SADHANA, Academy Proceedings in Engineering Sciencesの電子版
に掲載されました。(2011.11)
- 3月7日(月)に上智大学(東京:四谷)で
WAVE workshopを開催しました。(2011.3.7)
- NCSP2011 で、STRAIGHTの最新の動向について、基調講演をしました。(2011.3.1-3)
- 歌声に関するワークショップ InterSinging2010の体験デモに、
TANDEM-STRAIGHTとモーフィングを出展しました。(2010.10.1-2)
-
TANDEM-STRAIGHTの動作を紹介するムービー
を作成しました。
SSW7のチュートリアルでは、
このムービーを使って数式と処理内容の橋渡しのイメージを理解してもらうように努めました。
(講演スライド(PDF))
(2010.9.25)
-
情報処理学会 音楽情報科学研究会(夏シンポ2010)イベント企画
スペシャルセッション「歌声情報処理最前線!」 (2010.7.28-30)
ニコニコ生放送で動画中継された内容(提供: ニコニコ学術チャンネル、撮影: 伊予柑様)
私の出番は2:32:00辺りからです。参加者になったつもりで視聴したところ、私の説明は早口過ぎでした。(
発表資料、
使ったスライド)
- TANDEM-STRAIGHTと新しい時変モーフィングの紹介とGUIのマニュアルが
APSIPAの会議資料として公開されました。(Oct, 2009)
- 日本音響学会秋季研究発表会の招待講演(2009.9.16)の
「ムービーで理解する、パワースペクトル、瞬時周波数、群遅延」で使ったDVDを公開しました。
元々は、legacy-STRAIGHTの紹介用です。サイズが796MBですので、ご注意下さい。
- CrestMuseプロジェクトの成果を紹介する
ビデオが公開されました。
STRAIGHTは、基盤技術としてそれらの成果を支えています。(2008.11.10)
- TANDEM-STRAIGHT(
ムービーへのリンク:117MB)とリアルタイムモーフィングインタフェース
( デモへのリンク)を
8月22日のCrestMuseシンポジウムで発表/デモしました。
(プログラム)(2008.8.22)
-
5月の音楽情報研究会で、STRAIGHTの簡易モーフィングと
リアルタイムモーフィングインタフェースを発表しました。ネットでも話題になっているようです。(2008.5.28-29)
- 4th Conference on Speech Prosody, Campinus, Brazilで
総括講演(TANDEM-STRAIGHT, a research tool for L2 study enabling flexible manipulations of prosodic information)を行いました。(2008.5.6-9)
-
文化庁メディア芸術祭:2008.2.6?2.17の先端技術ショーケース'08
(パンフレット[pdf])
に
感情音声モーフィング(今回は流行語大賞の言葉)を出展しました。
- 日米音響学会ジョイントミーティングで
招待講演(STRAIGHT as a research tool for L2 study:
How to manipulate segmental and supra-segmental features)を行いました。(2006.11.29)
[presentation slides (pdf)]
[morphed synthetic R/L continuum (wmv)]
[morphed natural R/L continuum (wmv)]
- 日米音響学会ジョイントミーティングの発表
(
"Voice quality of artistic expression in Noh:
An analysis-synthesis study on source-related parameters")
が、米国音響学会のPress Room (Lay language paper)に掲載されています。(2006.11.28)
- 第9回西大平洋音響学会議で総括講演
(Precursor to Ecologically Relevant Speech Science)を行いました。(2006.6.28)
- 予感研究所(日本未来館)で
感情音声モーフィングを展示しました(2006.5.3?7)
- 2006年1月26,27日の
音声研究会
が和歌山大学で開催されました。
26日のSTRAIGHTのスペシャルセッションでは,11件の研究発表が行われました。
- 国際比較(Blizzard challange)においてSTRAIGHT技術を用いた音声合成システム(TTSシステム)の
圧倒的な高品質が評価されました(INTERSPEECH2005)。(2005.9, 2006.9).
- 新しいCRESTプロジェクト
「時系列メディアのデザイン転写技術の開発」(代表:片寄晴弘 教授)が発足しました。(2005.9).
- 米国音響学会
第149回会合(2005.5)でのスケール知覚の特別セッション
(企画:
Patterson(CNBH)、
入野(和歌山大学))において「STRAIGHTのスケール知覚研究への応用」
の招待講演を行いました。
- 日本科学未来館の特別企画展
『恋愛物語展 ? どうして一人ではいられないの??』(2005.4/23?8/15)に
STRAIGHT を用いた感情モーフィングのデモ(Flashムービー)
(説明)が展示されました。
会場でのラウンジトーク(6/26)
で技術的背景などを紹介しました。
-
STRAIGHTを用いて合成された合唱がRENCON'04において最も優れた合成歌唱と評価されました(2004.6)
- 和歌山市の名勝「番所庭園」でWAVE
: Wakayama workshop on Auditory and Vocal rEsearchを開催しました(2004.4)
- 高品質音声分析変換合成システムSTRAIGHT
(STRAIGHTの紹介),
(STRAIGHT試用版)
(登録利用者は最新版STRAIGHTV40を使用できます:2005.12.4更新)
- 「多様な音声合成プログラム」サブグループリーダー(2003年より)(
文部科学省リーディングプロジェクト e-Society
「
ユーザ負担のない話者?環境適応性を実現する自然な音声対話処理技術」代表:鹿野清宏 奈良先端大)
- CREST
「聴覚脳プロジェクト」
研究代表者(1997年?2002年)
(CMAP-CREST workshop 2002)
Last update: Fri Dec 3 03:37:36 JST 2021