Wang, Hsin-Min Homepage

Publications

Journal Articles 1. Pei-Jun Liao, Hung-Shin Lee, Yao-Fei Cheng, Li-Wei Chen, Hung-yi Lee, and Hsin-Min Wang, "Generalized Stock Price Prediction for Multiple Stocks Combined with News Fusion," to appear in Journal of Information Science and Engineering, arXiv:2603.19286 ::: 2. Chien-Chun Wang,Hung-Shin Lee,Hsin-Min Wang, and Berlin Chen, "DeRA-MOS: Optimizing Text-to-Music Evaluation via Decoupled Listwise Ranking and Modality Alignment," to appear in IEEE Signal Processing Letters, arXiv:2606.10010 ::: 3. Whenty Ariyanti, Kuan-Yu Chen, Sabato Marco Siniscalchi, Hsin-Min Wang, and Yu Tsao, "Towards Robust Assessment of Pathological Voices via Combined Low-Level Descriptors and Foundation Model Representations," to appear in IEEE Journal of Biomedical and Health Informatics, arXiv:2505.21356 4. Ammarah Hashmi, Sahibzada Adil Shahzad, Chia-Wen Lin, Yu Tsao, and Hsin-Min Wang, "Understanding Audiovisual Deepfake Detection: Techniques, Challenges, Human Factors, and Perceptual Insights," IEEE Computational Intelligence Magazine, volume 21, number 2, pages 38-54, May 2026, arXiv:2411.07650 5. Shafique Ahmed, Ryandhimas E. Zezario, Hui-Guan Yuan, Amir Hussain, Hsin-Min Wang, Wei-Ho Chung, and Yu Tsao, "NeuroAMP: A Novel End-to-end General Purpose Deep Neural Amplifier for Personalized Hearing Aids," IEEE Transactions on Artificial Intelligence, volume 7, pages 1610-1625, March 2026, arXiv:2502.10822 ::: 6. Chien-Chun Wang, Hung-Shin Lee, Hsin-Min Wang, and Berlin Chen, "Universal Robust Speech Adaptation for Cross-Domain Speech Recognition and Enhancement," IEEE Transaction on Audio, Speech and Language Processing, volume 34, pages 1229-1242, February 2026. ::: 7. Pei-Jun Liao, Hung-Yi Lee, and Hsin-Min Wang, "Cross-Attention Reprogramming for ASR: Bridging Discrete Speech Units and Pretrained Language Models," IEEE Access, volume 14, pages 662-678, January 2026. ::: 8. Sahibzada Adil Shahzad, Ammarah Hashmi, Yan-Tsung Peng, Yu Tsao, and Hsin-Min Wang, "AV-Lip-Sync+: Leveraging AV-HuBERT to Exploit Multimodal Inconsistency for Deepfake Detection of Frontal Face Videos," IEEE Transactions on Human-Machine Systems, volume 55, number 6, pages 973 - 982, December 2025, arXiv: 2311.02733 ::: 9. Ammarah Hashmi, Sahibzada Adil Shahzad, Chia-Wen Lin, Yu Tsao, and Hsin-Min Wang, "AVTENet: A Human-Cognition-Inspired Audio-Visual Transformer-Based Ensemble Network for Video Deepfake Detection," IEEE Transactions on Cognitive and Developmental Systems, volume 17, number 6, pages 1360-1376, December 2025, arXiv:2310.13103 ::: 10. Ming-Chi Yen, Chia-Hua Wu, Shu-Wei Tsai, Jyh-Shing Roger Jang, Yu Tsao, Amir Hussain, and Hsin-Min Wang, "Mandarin Electrolaryngeal Speech Voice Conversion with Speech Encoder Loss Learning and Seq2seq Modeling," IEEE Internet of Things Magazine, volume 8, number 4, pages 22-28, July 2025. ::: 11. Sahibzada Adil Shahzad, Ammarah Hashmi, Yan-Tsung Peng, Yu Tsao, and Hsin-Min Wang, "How Good is ChatGPT at Audiovisual Deepfake Detection: A Comparative Study of ChatGPT, AI Models and Human Perception," APSIPA Transactions on Signal and Information Processing, volume 14, number 1, e11, June 2025, arXiv:2411.09266 ::: 12. Dyah A. M. G. Wisnu, Stefano Rini, Ryandhimas E. Zezario, Hsin-Min Wang, and Yu Tsao, "HAAQI-Net: A Non-intrusive Neural Music Audio Quality Assessment Model for Hearing Aids," IEEE Transaction on Audio, Speech and Language Processing, volume 33, pages 1877-1892, February 2025, arXiv:2401.01145 ::: 13. Hsin-Tien Chiang, Szu-Wei Fu, Hsin-Min Wang, Yu Tsao, and John H. L. Hansen, "Multi-objective Non-intrusive Hearing-aid Speech Assessment Model," The Journal of the Acoustical Society of America, volume 156, number 5, pages 3574–3587, November 2024, arXiv:2311.08878 ::: 14. Erica Cooper, Wen-Chin Huang, Yu Tsao, Hsin-Min Wang, Tomoki Toda, Junichi Yamagishi, "A review on subjective and objective evaluation of synthetic speech," Acoustical Science and Technology, volume 45, number 4, pages 161-183, April 2024. ::: 15. Qian-Bei Hong, Chung-Hsien Wu, and Hsin-Min Wang, "Decomposition and Reorganization of Phonetic Information for Speaker Embedding Learning," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 31, pages 1745-1757, 2023. ::: 16. Ryandhimas E. Zezario, Szu-Wei Fu, Fei Chen, Chiou-Shann Fuh, Hsin-Min Wang, and Yu Tsao, "Deep Learning-based Non-Intrusive Multi-Objective Speech Assessment Model with Cross-Domain Features," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 31, pages 54-70, 2023, arXiv:2111.02363 ::: 17. Qian-Bei Hong, Chung-Hsien Wu, and Hsin-Min Wang, "Generalization Ability Improvement of Speaker Representation and Anti-Interference for Speaker Verification," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 31, pages 486-499, 2023. ::: 18. Chin-Yi Cheng, Hung-Shin Lee, Yu Tsao, Hsin-Min Wang, "Multi-target Extractor and Detector for Unknown-number Speaker Diarization," IEEE Signal Processing Letters, volume 30, pages 638-642, 2023, arXiv:2203.16007 ::: 19. Qian-Bei Hong, Chung-Hsien Wu, and Hsin-Min Wang, "Speaker-Specific Articulatory Feature Extraction Based on Knowledge Distillation for Speaker Recognition," APSIPA Transactions on Signal and Information Processing, volume 12, number 2, e10, April 2023. ::: 20. Yu-Wen Chen, Hsin-Min Wang, and Yu Tsao, "BASPRO: A balanced script producer for speech corpus collection based on the genetic algorithm," APSIPA Transactions on Signal and Information Processing, volume 12, number 3, e15, April 2023, arXiv:2301.04120 ::: 21. Aleksandra Smolka, Hsin-Min Wang, Jason S. Chang, and Keh-Yih Su, "Aligning Sentences in a Paragraph-Paraphrased Corpus with New Embedding-based Similarity Measures," International Journal of Computational Linguistics and Chinese Language Processing, volume 27, number 2, pages 1-30, December 2022. 22. Cheng-Hung Hu, Yu-Huai Peng, Junichi Yamagishi, Yu Tsao, and Hsin-Min Wang, "SVSNet: An End-to-end Speaker Voice Similarity Assessment Model," IEEE Signal Processing Letters, volume 29, pages 767-771, 2022, arXiv:2107.09392 ::: 23. Shang-Yi Chuang, Hsin-Min Wang, and Yu Tsao, "Improved Lite Audio-Visual Speech Enhancement," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 30, pages 1345-1359, 2022, arXiv:2008.13222 ::: 24. Chao-Chun Liang, Daniel Lee, Meng-Tse Wu, Hsin-Min Wang, and Keh-Yih Su, "Answering Chinese Elementary School Social Studies Multiple Choice Questions," International Journal of Computational Linguistics and Chinese Language Processing, volume 26, number 2, pages 67-84, December 2021. 25. Natalie Yu-Hsien Wang, Hsiao-Lan Sharon Wang, Tao-Wei Wang, Szu-Wei Fu, Xugan Lu, Hsin-Min Wang, and Yu Tsao, "Improving the Intelligibility of Speech for Simulated Electric and Acoustic Stimulation Using Fully Convolutional Neural Networks," IEEE Transactions on Neural Systems and Rehabilitation Engineering, volume 29, pages 184-195, 2021. 26. Wen-Li Wei, Jen-Chun Lin, Tyng-Luh Liu, Hsiao-Rong Tyan, Hsin-Min Wang, and Hong-Yuan Mark Liao, "Learning To Visualize Music Through Shot Sequence For Automatic Concert Video Mashup," IEEE Transactions on Multimedia, volume 23, pages 1731-1743, 2021. 27. Xin Wang, Junichi Yamagishi, ..., Hsin-Min Wang, et al., "ASVspoof 2019: a large-scale public database of synthetized, converted and replayed speech," Computer Speech and Language, volume 64, pages Article 101114, November 2020, arXiv:1911.01601 28. Hung-Shin Lee, Yu Tsao, Shyh-Kang Jeng, and Hsin-Min Wang, "Subspace-based Representation and Learning for Phonotactic Spoken Language Recognition," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 28, pages 3065-3079, November 2020. ::: 29. Tsun-An Hsieh, Hsin-Min Wang, Xugang Lu, and Yu Tsao, "WaveCRN: An Efficient Convolutional Recurrent Neural Network for End-to-end Speech Enhancement," IEEE Signal Processing Letters, volume 27, pages 2149 - 2153, November 2020, arXiv:2004.04098 ::: 30. Cheng Yu, Ryandhimas E. Zezario, Syu-Siang Wang, Jonathan Sherman, Yi-Yen Hsieh, Xugang Lu, Hsin-Min Wang, and Yu Tsao, "Speech Enhancement based on Denoising Autoencoder with Multi-branched Encoders," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 28, pages 2756 - 2769, October 2020, arXiv:2001.01538 31. Wen-Chin Huang, Hao Luo, Hsin-Te Hwang, Chen-Chou Lo, Yu-Huai Peng, Yu Tsao, and Hsin-Min Wang, "Unsupervised Representation Disentanglement using Cross Domain Features and Adversarial Learning in Variational Autoencoder based Voice Conversion," IEEE Transactions on Emerging Topics in Computational Intelligence, volume 4, number 4, pages 468-479, August 2020, arXiv:2001.07849 32. Chang-Le Liu, Sze-Wei Fu, You-Jin Li, Jen-Wei Huang, Hsin-Min Wang, and Yu Tsao, "Multichannel Speech Enhancement by Raw Waveform-mapping using Fully Convolutional Networks," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 28, pages 1888-1900, February 2020, arXiv:1909.11909 33. Hsin-Te Hwang, Yi-Chiao Wu, Yu-Huai Peng, Chin-Cheng Hsu, Yu Tsao, Hsin-Min Wang, Yih-Ru Wang, and Sin-Horng Chen, "Voice Conversion Based on Locally Linear Embedding," Journal of Information Science and Engineering, volume 34, number 6, pages 1493-1516, November 2018. ::: 34. Jen-Chun Lin, Wen-Li Wei, Tyng-Luh Liu, Yi-Hsuan Yang, Hsin-Min Wang, Hsiao-Rong Tyan, and Hong-Yuan Mark Liao, "Coherent Deep-Net Fusion To Classify Shots In Concert Videos," IEEE Transactions on Multimedia, volume 20, number 11, pages 3123-3136, November 2018. ::: 35. Hsin-Te Hwang, Yi-Chiao Wu, Syu-Siang Wang, Chin-Cheng Hsu, Yu Tsao, Hsin-Min Wang, Yih-Ru Wang, and Sin-Horng Chen, "Locally Linear Embedding Based Post-filtering for Speech Enhancement," Journal of Information Science and Engineering, volume 34, number 6, pages 1469-1491, November 2018. ::: 36. Jen-Cheng Hou, Syu-Siang Wang, Ying-Hui Lai, Yu Tsao, Hsiu-Wen Chang, and Hsin-Min Wang, "Audio-Visual Speech Enhancement using Multimodal Deep Convolutional Neural Networks," IEEE Transactions on Emerging Topics in Computational Intelligence, volume 2, number 2, pages 117-128, April 2018. ::: 37. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen, and Hsin-Min Wang, "An Information Distillation Framework for Extractive Summarization," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 26, number 1, pages 161-170, January 2018. ::: 38. Tien-Hong Lo, Ying-Wen Chen, Kuan-Yu Chen, Hsin-Min Wang and Berlin Chen, "On the Use of Neural Network Modeling Techniques for Spoken Document Retrieval," International Journal of Computational Linguistics and Chinese Language Processing, volume 22, number 2, pages 1-16, December 2017, (in Chinese) 39. Chia-Lung Wu, Hsiang-Ping Hsu, Yu-Ding Lu, Yu Tsao, Hung-Shin Lee and Hsin-Min Wang, "A Replay Spoofing Detection System Based on Discriminative Autoencoders," International Journal of Computational Linguistics and Chinese Language Processing, volume 22, number 2, pages 63-72, December 2017, (in Chinese) 40. Shih-Hung Liu, Kuan-Yu Chen, Yu-Lun Hsieh, Berlin Chen, Hsin-Min Wang, Hsu-Chun Yen, and Wen-Lian Hsu, "A Position-Aware Language Modeling Framework for Extractive Broadcast News Speech Summarization," ACM Transactions on Asian and Low-Resource Language Information Processing, volume 16, number 4, pages 1-13, Article 27, August 2017. 41. Yu-Ren Chien, Hsin-Min Wang, and Shyh-Kang Jeng, "Alignment of Lyrics With Accompanied Singing Audio Based on Acoustic-Phonetic Vowel Likelihood Modeling," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 24, number 11, pages 1998 - 2008, November 2016. ::: 42. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen, Hsin-Min Wang, and Hsin-Hsi Chen, "Exploring the Use of Unsupervised Query Modeling Techniques for Speech Recognition and Summarization," Speech Communication, volume 80, pages 49-59, June 2016. ::: 43. Ting-Hao Chang, Hsiao-Tsung Hung, Kuan-Yu Chen, Hsin-Min Wang, and Berlin Chen, "Investigating modulation spectrum factorization techniques for robust speech recognition," International Journal of Computational Linguistics and Chinese Language Processing, volume 20, number 2, pages 87-106, December 2015, (in Chinese) 44. Kai-Wun Shih, Kuan-Yu Chen, Shih-Hung Liu, Hsin-Min Wang, and Berlin Chen, "Extractive spoken document summarization with representation learning techniques," International Journal of Computational Linguistics and Chinese Language Processing, volume 20, number 2, pages 65-86, December 2015, (in Chinese) 45. Kuan-Yu Chen, Hsin-Min Wang, and Hsin-Hsi Chen, "A Probabilistic Framework for Chinese Spelling Check," ACM Transactions on Asian and Low-Resource Language Information Processing, volume 14, number 4, Article 15, pages 1-17, October 2015. ::: 46. Yu-Ren Chien, Hsin-Min Wang, and Shyh-Kang Jeng, "An Acoustic-Phonetic Model of F0 Likelihood for Vocal Melody Extraction," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 23, number 9, pages 1457-1468, September 2015. ::: 47. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen, Hsin-Min Wang, Ea-Ee Jan, Wen-Lian Hsu, Hsin-Hsi Chen, "Extractive broadcast news summarization leveraging recurrent neural network language modeling techniques," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 23, number 8, pages 1322-1334, August 2015. ::: 48. Shih-Hung Liu, Kuan-Yu Chen, Berlin Chen, Hsin-Min Wang, Hsu-Chun Yen, and Wen-Lian Hsu, "Combining Relevance Language Modeling and Clarity Measure for Extractive Speech Summarization," IEEE/ACM Transactions on Audio, Speech, and Language Processing, volume 23, number 6, pages 957 - 969, June 2015. ::: 49. Ju-Chiang Wang, Yi-Hsuan Yang, Hsin-Min Wang, and Shyh-Kang Jeng, "Modeling the Affective Content of Music with a Gaussian Mixture Model," IEEE Transactions on Affective Computing, volume 6, number 1, pages 56 - 68, March 2015. ::: 50. Hung-Yi Lo, Shou-De Lin, and Hsin-Min Wang, "Generalized k-Labelsets Ensemble for Multi-Label and Cost-Sensitive Classification," IEEE Transactions on Knowledge and Data Engineering, volume 26, number 7, pages 1679-1691, July 2014. ::: 51. Berlin Chen, Yi-Wen Chen, Kuan-Yu Chen, Hsin-Min Wang, and Kuen-Tyng Yu, "Enhancing query formulation for spoken document retrieval," Journal of Information Science and Engineering, volume 30, number 3, pages 553-569, May 2014. 52. Kuan-Yu Chen, Hsin-Min Wang, and Berlin Chen, "Spoken Document Retrieval Leveraging Unsupervised and Supervised Topic Modeling Techniques," IEICE Trans. on Information and Systems, volume E95-D, number 5, pages 1195-1205, May 2012. ::: 53. Hung-Yi Lo, Ju-Chiang Wang, Hsin-Min Wang, and Shou-De Lin, "Cost-sensitive Multi-label Learning for Audio Tag Annotation and Retrieval," IEEE Transactions on Multimedia, volume 13, number 3, pages 518-529, June 2011. ::: 54. Chih-Yi Chiu and Hsin-Min Wang, "Time-series Linear Search for Video Copies Based on Compact Signature Manipulation and Containment Relation Modeling," IEEE Trans. on Circuits and Systems for Video Technology, volume 20, number 11, pages 1603 - 1613, November 2010. ::: 55. Chih-Yi Chiu, Hsin-Min Wang, Chu-Song Chen, "Fast Min-hashing Indexing and Robust Spatio-temporal Matching for Detecting Video Copies," ACM Transactions on Multimedia Computing, Communications and Applications, volume 6, number 2, pages 10: 1-23, March 2010. ::: 56. Shih-Sian Cheng, Hsin-Min Wang, and Hsin-Chia Fu, "BIC-Based Speaker Segmentation Using Divide-and-Conquer Strategies with Application to Speaker Diarization," IEEE Trans. on Audio, Speech, and Language Processing, volume 18, number 1, pages 141-157, January 2010. ::: 57. Yi-Hsiang Chao, Wei-Ho Tsai, Hsin-Min Wang, and Ruei-Chuan Chang, "Improving the Characterization of the Alternative Hypothesis via Minimum Verification Error Training with Applications to Speaker Verification," Pattern Recognition, volume 42, number 7, pages 1351-1360, July 2009. ::: 58. Yi-Hsiang Chao, Wei-Ho Tsai and Hsin-Min Wang, "Improving GMM-UBM Speaker Verification Using Discriminative Feedback Adaptation," Computer Speech and Language, volume 23, number 3, pages 376-388, July 2009. ::: 59. Shih-Sian Cheng, Hsin-Chia Fu, and Hsin-Min Wang, "Model-Based Clustering by Probabilistic Self-Organizing Maps," IEEE Trans. on Neural Networks, volume 20, number 5, pages 805-826, May 2009, demonstration: https://sites.google.com/site/shihsiancheng/PbSOMBox ::: 60. Wei-Ho Tsai and Hsin-Min Wang, "Evolutionary Minimization of the Rand Index for Speaker Clustering," Computer Speech and Language, volume 23, number 2, pages 165-175, April 2009. ::: 61. Shih-Hsiang Lin, Berlin Chen, and Hsin-Min Wang, "A Comparative Study of Probabilistic Ranking Models for Chinese Spoken Document Summarization," ACM Transactions on Asian Language Information Processing, volume 8, number 1, pages 3:1-23, March 2009. 62. Yi-Ting Chen, Berlin Chen, Hsin-Min Wang, "A Probabilistic Generative Framework for Extractive Broadcast News Speech Summarization," IEEE Trans. on Audio, Speech, and Language Processing, volume 17, number 1, pages 95-106, January 2009. ::: 63. Hung-Ming Yu, Wei-Ho Tsai, and Hsin-Min Wang, "A Query-by-Singing System for Retrieving Karaoke Music," IEEE Trans. on Multimedia, volume 10, number 8, pages 1626-1637, December 2008. ::: 64. Wei-Ho Tsai, Hung-Ming Yu, and Hsin-Min Wang, "Using the Similarity of Main Melodies to Identify Cover Versions of Popular Songs for Music Document Retrieval," Journal of Information Science and Engineering, volume 24, number 6, pages 1669-1687, November 2008. ::: 65. Yi-Hsiang Chao, Wei-Ho Tsai, Hsin-Min Wang, and Ruei-Chuan Chang, "Using Kernel Discriminant Analysis to Improve the Characterization of the Alternative Hypothesis for Speaker Verification," IEEE Trans. on Audio, Speech, and Language Processing, volume 16, number 8, pages 1675-1684, November 2008. ::: 66. Yi-Hsiang Chao, Hsin-Min Wang, and Ruei-Chuan Chang, "A Novel Characterization of the Alternative Hypothesis Using Kernel Discriminant Analysis for LLR-based Speaker Verification," International Journal of Computational Linguistics and Chinese Language Processing, volume 12, number 3, pages 255-272, September 2007. 67. Wei-Ho Tsai and Hsin-Min Wang, "Automatic Identification of the Sung Language in Popular Music Recordings," Journal of New Music Research, volume 32, number 2, pages 105-114, June 2007. ::: 68. Wei-Ho Tsai, Shih-Sian Cheng, and Hsin-Min Wang, "Automatic Speaker Clustering Using a Voice Characteristic Reference Space and Maximum Purity Estimation," IEEE Trans. on Audio, Speech, and Language Processing, volume 15, number 4, pages 1461-1474, May 2007. ::: 69. Hwai-Tsu Hu and Hsin-Min Wang, "Integrating coding techniques into LP-based Mandarin text-to-speech synthesis," International Journal of Speech Technology, volume 10, number 1, pages 31-44, March 2007. 70. Jen-Wei Kuo, Shih-Hung Liu, Hsin-min Wang, and Berlin Chen, "An Empirical Study on Word Error Minimization Approaches for Mandarin Large Vocabulary Continuous Speech Recognition," International Journal of Computational Linguistics and Chinese Language Processing, volume 11, number 3, pages 201-222, September 2006. ::: 71. Wei-Ho Tsai and Hsin-min Wang, "Speech Utterance Clustering Based on the Maximization of Within-cluster Homogeneity of Speaker Voice Characteristics," The Journal of the Acoustical Society of America, volume 120, number 3, pages 1631-1645, September 2006. ::: 72. Chuang-Hua Chueh, Hsin-min Wang, and Jen-Tzung Chien, "A Maximum Entropy Approach for Semantic Language Modeling," International Journal of Computational Linguistics and Chinese Language Processing, volume 11, number 1, pages 37-56, March 2006. ::: 73. Wei-Ho Tsai and Hsin-min Wang, "Automatic singer recognition of popular music recordings via estimation and modeling of solo vocal signals," IEEE Trans. on Audio, Speech, and Language Processing, volume 14, number 1, pages 330-341, January 2006. ::: 74. Chiu-yu Tseng, Shao-huang Pin, Yehlin Lee, Hsin-min Wang, Yong-cheng Chen, "Fluent speech prosody: framework and modeling," Speech Communication, volume 46, number 3-4, pages 284-309, July 2005. ::: 75. Hsin-min Wang, Berlin Chen, Jen-Wei Kuo, and Shih-Sian Cheng, "MATBN: A Mandarin Chinese Broadcast News Corpus," International Journal of Computational Linguistics and Chinese Language Processing, volume 10, number 2, pages 219-236, June 2005. ::: 76. Shih-Sian Cheng, Hsin-min Wang, and Hsin-Chia Fu, "A Model-selection-based Self-splitting Gaussian Mixture Learning with Application to Speaker Identification," EURASIP Journal on Applied Signal Processing, volume 2004, number 17, pages 2626-2639, December 2004. ::: 77. Berlin Chen, Hsin-min Wang, and Lin-shan Lee, "A Discriminative Hmm/N-Gram-Based Retrieval Approach for Mandarin Spoken Documents," ACM Transactions on Asian Language Information Processing, volume 3, number 2, pages 128-145, June 2004. ::: 78. Hsin-min Wang, Shi-sian Cheng, and Yong-cheng Chen, "The SoVideo Mandarin Chinese Broadcast News Retrieval System," International Journal of Speech Technology, volume 7, number 2, pages 189-202, April 2004. ::: 79. Helen Meng, Berlin Chen, Sanjeev Khudanpur, Gina-Anne Levow, Wai-kit Lo, Douglas Oard, Patrick Schone, Karen Tang, Hsin-min Wang, and Jianqiang Wang, "Mandarin-English Information (MEI): Investigating Translingual Speech Retrieval," Computer Speech and Language, volume 18, number 2, pages 163-179, April 2004. 80. Wei-Ho Tsai, Dwight Rodgers, and Hsin-min Wang, "Blind Clustering of Popular Music Recordings Based on Singer Voice Characteristics," Computer Music Journal, volume 28, number 3, pages 68-78, 2004. ::: 81. Berlin Chen, Hsin-min Wang, and Lin-shan Lee, "Discriminating Capabilities of Syllable-based Features and Approaches of Utilizing Them for Voice Retrieval of Speech Information in Mandarin Chinese," IEEE Trans. on Speech and Audio Processing, volume 10, number 5, pages 303-314, July 2002. 82. Bor-shen Lin, Berlin Chen, Hsin-min Wang, and Lin-shan Lee, "A Hierarchical Tag-Graph Search Scheme with Layered Grammar Rules for Spontaneous Speech Understanding," Pattern Recognition Letters, volume 23, number 7, pages 819-831, May 2002, The preliminary version also appeared in Proc. International Conference on Spoken Language Processing (ICSLP98), Sydney, Australia, Dec. 1998 83. Bor-shen Lin, Hsin-min Wang, and Lin-shan Lee, "A Distributed Agent Architecture for Intelligent Multi-Domain Spoken Dialogue Systems," IEICE Trans. on Information and Systems, volume E84-D, number 9, pages 1217-1230, September 2001. 84. Hsin-min Wang and Berlin Chen, "Content-based Language Models for Spoken Document Retrieval," International Journal of Computer Processing of Oriental Languages, volume 14, number 2, pages 193-209, June 2001. 85. Hsin-min Wang, "Experiments in Syllable-based Retrieval of Broadcast News Speech in Mandarin Chinese," Speech Communication, volume 32, number 1-2, pages 49-60, September 2000. 86. Bo-ren Bai, Berlin Chen, and Hsin-min Wang, "Syllable-based Chinese Text/Spoken Document Retrieval Using Text/Speech Queries," International Journal of Pattern Recognition and Artificial Intelligence, volume 14, number 5, pages 603-616, August 2000, The preliminary version also appeared in Proc. The 2nd International Conference on Multimodal Interface (ICMI'99), Hong-kong, Jan. 1999, pp. II46-II51 87. Hsin-min Wang, "Mandarin Spoken Document Retrieval based on Syllable Lattice Matching," Pattern Recognition Letters, volume 21, pages 615-624, June 2000, The preliminary version also appeared in Proc. Int. Workshop on Information Retrieval with Asian Languages (IRAL'99), Taipei, Nov. 1999, pp. 48-54 88. Hsin-min Wang, Yu-hsueh Chou, and Berlin Chen, "Browsing the Chinese Web Pages Using Mandarin Speech," International Journal of Computer Processing of Oriental Languages, volume 13, number 1, pages 35-51, 2000, The preliminary version also appeared in Proc. The 18th International Conference on Computer Processing of Oriental Languages (ICCPOL'99), Tokushima J 89. Lee-feng Chien and Hsin-min Wang, "Exploration of Robust Techniques for Mandarin Spoken Information Retrieval," Journal of the Chinese Institute of Electrical Engineering, volume 7, number 2, pages 113-121, 2000. 90. Lee-feng Chien, Hsin-min Wang, Bo-ren Bai and Sung-chien Lin, "A Spoken Access Approach for Chinese Text and Speech Information Retrieval," Journal of the American Society for Information Science, volume 51, number 4, pages 313-323, 2000. 91. Jia-lin Shen, Hsin-min Wang, Ren-yuan Lyu, and Lin-shan Lee, "Automatic Selection of Phonetically Distributed Sentence Sets for Speaker Adaptation With Application to Large Vocabualry Mandarin Speech Recognition," Computer Speech and Language, volume 13, number 1, pages 79-97, January 1999. 92. Hsin-min Wang, "Statistical Analysis of Mandarin Acoustic Units and Automatic Extraction of Phonetically Rich Sentences Based Upon A Very Large Chinese Text Corpus," International Journal of Computational Linguistics and Chinese Language Processing, volume 3, number 4, pages 93-114, August 1998. 93. Hsin-min Wang, Tai-hsuan Ho, Rung-chiung Yang, Jia-lin Shen, Bo-ren Bai, Jenn-chau Hong, Wei-peng Chen, Tong-lo Yu, and Lin-shan Lee, "Complete recognition of continuous Mandarin speech for Chinese language with very large vocabulary using limited training data," IEEE Trans. on Speech and Audio Processing, volume 5, number 2, pages 195-200, March 1997. 94. Chih-Heng Lin, Chien-Hsing Wu, Pei-Yih Ting, and Hsin-min Wang, "Frameworks for recognition of Mandarin syllables with tone using sub-syllabic units," Speech Communication, volume 18, number 2, pages 175-190, 1996. 95. Hsin-min Wang, Renyuan Lyu, Jia-lin Shen, and Lin-shan Lee, "Mandarin syllable recognition in continuous speech under limited training data with sub-syllabi c acoustic modeling," International Journal of Computer Processing of Chinese and Oriental Languages, volume 8, pages 1-16, December 1994. 96. Hsin-min Wang and Lin-shan Lee, "Tone recognition for continuous Mandarin speech with limited training data using selected context-dependent hidden Markov models," Journal of The Chinese Institute of Engineers, volume 17, number 6, pages 775-784, 1994. Conference Papers 1. Chih-Ning Chen, Jen-Cheng Hou, Hsin-Min Wang, Shao-Yi Chien, Yu Tsao, Fan-Gang Zeng, "LLM-Guided Reinforcement Learning for Audio-Visual Speech Enhancement," to appear in Interspeech2026,. ::: 2. Devin Chang, Hsin-Te Hwang, Ming-Chi Yen, Shu-Wei Tsai, Yu Tsao, Hsin-Min Wang, "Personalized Electrolaryngeal Voice Conversion with a Single Pre-operative Utterance," to appear in Interspeech2026,. ::: 3. Wenze Ren, Yi-Cheng Lin, Wen-Chin Huang, Erica Cooper, Ryandhimas E. Zezario, Hsin-Min Wang, Hung-yi Lee, Yu Tsao, "MOS-Bias: From Hidden Gender Bias to Gender-Aware Speech Quality Assessment," to appear in Interspeech2026,. ::: 4. Qi-Yan Chen, Ming-Chi Yen, Fo-Rui Li, Hsin-Te Hwang, Ching-Hung Lai, Shu-Wei Tsai, Ping-Cheng Yeh, Jyh-Shing Roger Jang, Yu Tsao, Hsin-Min Wang, "A Preclinical Study of Electrolaryngeal Voice Conversion for a Novel Nasal Electrolarynx: Feature Choice and Data Augmentation," to appear in Interspeech2026,. ::: 5. Kuan-Tang Huang, Chien-Chun Wang, Cheng-Yeh Yang, Hung-Shin Lee, Hsin-Min Wang, and Berlin Chen, "Robust Generative Audio Quality Assessment: Disentangling Quality from Spurious Correlations," IEEE International Conference on Multimedia and Expo (ICME), July 2026. ::: 6. An-Ci Peng, Kuan-Tang Huang, Tien-Hong Lo, Hung-Shin Lee, Hsin-Min Wang, and Berlin Chen, "Efficient Dialect-Aware Modeling and Conditioning for Low-Resource Taiwanese Hakka Speech Processing," Language Resources and Evaluation Conference (LREC2026), May 2026. ::: 7. Ryandhimas E. Zezario, Dyah A.M.G. Wisnu, Szu-Wei Fu, Sabato Marco Siniscalchi, Hsin-Min Wang, Yu Tsao, "Few-shot and Pseudo-label Guided Speech Quality Evaluation with Large Language Models," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2026), May 2026. ::: 8. Cheng-Yeh Yang, Chien-Chun Wang, Li-Wei Chen, Hung-Shin Lee, Hsin-Min Wang and Berlin Chen, "TG-ASR: Translation-Guided Learning with Parallel Gated Cross Attention for Low-Resource Automatic Speech Recognition," Language Resources and Evaluation Conference (LREC2026), May 2026. ::: 9. Kuan-Tang Huang, Li-Wei Chen, Hung-Shin Lee, Berlin Chen, and Hsin-Min Wang, "Revealing the Role of Audio Channels in ASR Performance Degradation," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2025), December 2025. ::: 10. Devin Chang, Ming-Chi Yen, Hsin-Te Hwang, Fo-Rui Li, Ching-Feng Liu, Yu Tsao, Hsin-Min Wang, "Two-stage Voice Conversion for Dysarthric Speech Reconstruction with Speaker Identity Preservation," The 30th International Conference on Technologies and Applications of Artificial Intelligence (TAAI 2025), December 2025. ::: 11. Dyah A. M. G. Wisnu, Ryandhimas E. Zezario, Stefano Rini, Hsin-Min Wang, and Yu Tsao, "Improving Perceptual Audio Aesthetic Assessment via Triplet Loss and Self-Supervised Embeddings," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2025), December 2025. ::: 12. Chien-Chun Wang, Kuan-Tang Huang, Cheng-Yeh Yang, Hung-Shin Lee, Hsin-Min Wang, and Berlin Chen, "QAMRO: Quality-aware Adaptive Margin Ranking Optimization for Human-aligned Assessment of Audio Generation Systems," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2025), December 2025. ::: 13. Wenze Ren, Yi-Cheng Lin, Wen-Chin Huang, Ryandhimas E. Zezario, Szu-Wei Fu, Sung-Feng Huang, Erica Cooper, Haibin Wu, Hung-Yu Wei, Hsin-Min Wang, Hung-yi Lee, Yu Tsao, "HighRateMOS: Sampling-Rate Aware Modeling for Speech Quality Assessment," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2025), December 2025. ::: 14. Yao-Fei Cheng, Li-Wei Chen, Hung-Shin Lee and Hsin-Min Wang, "Exploring the Impact of Data Quantity on ASR in Extremely Low-resource Languages," Oriental COCOSDA 2025: International Conference on Speech Databases and Assessments, November 2025. ::: 15. Chih-Hsi Chen, Pei-Jun Liao, Chia-Hua Wu, Pang Cheng Wu and Hsin-Min Wang, "The SLAM Hakka ASR System for Formosa Speech Recognition Challenge 2025," The 37th ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2025), November 2025. ::: 16. Fo-Rui Li, Hsin-Te Hwang, Ming-Chi Yen, Men-Tung Lo, Yu Tsao, and Hsin-Min Wang, "Improving Exemplar-Based Electrolaryngeal Speech Voice Conversion via Robust Content Representations," APSIPA Annual Summit and Conference (APSIPA ASC 2025), October 2025. ::: 17. Ryandhimas E. Zezario, Dyah A.M.G. Wisnu, Hsin-Min Wang, and Yu Tsao, "Speech Intelligibility Assessment with Uncertainty-Aware Whisper Embeddings and sLSTM," APSIPA Annual Summit and Conference (APSIPA ASC 2025), October 2025. ::: 18. Cheng-Yeh Yang, Kuan-Tang Huang, Chien-Chun Wang, Hung-Shin Lee, Hsin-Min Wang, and Berlin Chen, "DRASP: A Dual-Resolution Attentive Statistics Pooling Framework for Automatic MOS Prediction," APSIPA Annual Summit and Conference (APSIPA ASC 2025), October 2025. ::: 19. Yu-Chien Lin, Chia-Hua Wu, Yu Tsao, and Hsin-Min Wang, "Improving Speech Translation through Data Augmentation with Data in Similar Languages," EUSIPCO2025, September 2025. ::: 20. Ryandhimas E. Zezario, Sabato M. Siniscalchi, Fei Chen, Hsin-Min Wang, and Yu Tsao, "Feature Importance across Domains for Improving Non-Intrusive Speech Intelligibility Prediction in Hearing Aids," Interspeech2025, August 2025. ::: 21. Chia-Hua Wu, Wanying Ge, Xin Wang, Junichi Yamagishi, Yu Tsao, and Hsin-Min Wang, "A Comparative Study on Proactive and Passive Detection of Deepfake Speech," Interspeech2025, August 2025. ::: 22. Ryandhimas E. Zezario, Szu-Wei Fu, Dyah A.M.G. Wisnu, Hsin-Min Wang, Yu Tsao, "Non-Intrusive Multi-Branch Speech Intelligibility Prediction using Multi-Stage Training," The 6th Clarity Workshop on Improving Speech-in-Noise for Hearing Devices (Clarity-2025), August 2025. ::: 23. Shafique Ahmed, Ryandhimas E. Zezario, Nasir Saleem, Amir Hussain, Hsin-Min Wang, and Yu Tsao, "A Study on Speech Assessment with Visual Cues," Interspeech2025, August 2025. ::: 24. Ryandhimas E. Zezario, Dyah A.M.G. Wisnu, Hsin-Min Wang, and Yu Tsao, "A Study on Zero-Shot Non-Intrusive Speech Intelligibility for Hearing Aids Using Large Language Models," ICCE-TW 2025, July 2025. ::: 25. Chien-Chun Wang, Li-Wei Chen, Cheng-Kang Chou, Hung-Shin Lee, Berlin Chen, and Hsin-Min Wang, "Channel-Aware Domain-Adaptive Generative Adversarial Network for Robust Speech Recognition," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2025), April 2025. ::: 26. Jie Lin, I Chiu, Kuan-Chen Wang, Kai-Chun Liu, Hsin-Min Wang, Ping-Cheng Yeh, and Yu Tsao, "MSECG: Incorporating Mamba for Robust and Efficient ECG Super-Resolution," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2025), April 2025. ::: 27. Wenze Ren, Haibin Wu, Yi-Cheng Lin, Xuanjun Chen, Rong Chao, Kuo-Hsuan Hung, You-Jin Li, Wen-Yuan Ting, Hsin-Min Wang, and Yu Tsao, "Leveraging Joint Spectral and Spatial Learning with MAMBA for Multichannel Speech Enhancement," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2025), April 2025. ::: 28. Ryandhimas E. Zezario, Sabato M. Siniscalchi, Hsin-Min Wang, and Yu Tsao, "A Study on Zero-shot Non-intrusive Speech Assessment using Large Language Models," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2025), April 2025. ::: 29. Chien-Chun Wang, Li-Wei Chen, Hung-Shin Lee, Berlin Chen, and Hsin-Min Wang, "Effective Noise-aware Data Simulation for Domain-adaptive Speech Enhancement Leveraging Dynamic Stochastic Perturbation," IEEE Workshop on Spoken Language Technology (SLT2024), December 2024. ::: 30. Wenze Ren, Yi-Cheng Lin, Huang-Cheng Chou, Haibin Wu, Yi-Chiao Wu, Chi-Chun Lee, Hung-yi Lee, Hsin-Min Wang, and Yu Tsao, "EMO-Codec: An In-Depth Look at Emotion Preservation Capacity of Legacy and Neural Codec Models with Subjective and Objective Evaluations," APSIPA Annual Summit and Conference (APSIPA ASC 2024), December 2024. ::: 31. Wen-Chin Huang, Szu-Wei Fu, Erica Cooper, Ryandhimas E. Zezario, Tomoki Toda, Hsin-Min Wang, Junichi Yamagishi, and Yu Tsao, "The VoiceMOS Challenge 2024: Beyond Speech Quality Prediction," IEEE Workshop on Spoken Language Technology (SLT2024), December 2024. ::: 32. Aleksandra Smolka, Hsin-Min Wang, Jason S. Chang, and Keh-Yih Su, "Selecting Better ChatGPT Prompts for NLP Tasks," The 36th ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2024), November 2024. ::: 33. Pei-Jun Liao, Hung-Yi Lee, and Hsin-Min Wang, "Ensemble Knowledge Distillation from Speech SSL Models Considering Inter-teacher Differences," International Symposium on Chinese Spoken Language Processing (ISCSLP2024), November 2024. ::: 34. Wenze Ren, Kuo-Hsuan Hung, Rong Chao, YouJin Li, Hsin-Min Wang, and Yu Tsao, "Robust Audio-Visual Speech Enhancement: Correcting Misassignments in Complex Environments with Advanced Post-Processing," Oriental COCOSDA 2024: International Conference on Speech Databases and Assessments, October 2024. ::: 35. Hsin-Te Hwang, Chia-Hua Wu, Ming-Chi Yen, Yu Tsao, and Hsin-Min Wang, "Exemplar-Based Methods for Mandarin Electrolaryngeal Speech Voice Conversion," Oriental COCOSDA 2024: International Conference on Speech Databases and Assessments, October 2024. ::: 36. Ryandhimas E. Zezario, Fei Chen, Chiou-Shann Fuh, Hsin-Min Wang, and Yu Tsao, "Non-Intrusive Speech Intelligibility Prediction for Hearing Aids using Whisper and Metadata," Interspeech2024, September 2024. ::: 37. Sheng-Chieh Chiu, Chia-Hua Wu, Jih-Kang Hsieh, Yu Tsao, and Hsin-Min Wang, "Learnable Layer Selection and Model Fusion for Speech Self-Supervised Learning Models," Interspeech2024, September 2024. ::: 38. Shafique Ahmed, Chia-Wei Chen, Wenze Ren, Chin-Jou Li, Ernie Chu, Jun-Cheng Chen, Amir Hussain, Hsin-Min Wang, Yu Tsao, and Jen-Cheng Hou, "Deep Complex U-Net with Conformer for Audio-Visual Speech Enhancement," Interspeech2024-AVSEC-3 Workshop, September 2024. ::: 39. Chun Yin, Tai-Shih Chi, Yu Tsao, and Hsin-Min Wang, "SVSNet+: Enhancing Speaker Voice Similarity Assessment Models with Representations from Speech Foundation Models," Interspeech2024, September 2024. ::: 40. Ryandhimas E. Zezario, Yu-Wen Chen, Szu-Wei Fu, Yu Tsao, Hsin-Min Wang, and Chiou-Shann Fuh, "A Study on Incorporating Whisper for Robust Speech Assessment," IEEE International Conference on Multimedia and Expo (ICME), July 2024. ::: 41. Hsuan-Fu Wang, Yi-Jen Shih, Heng-Jui Chang, Layne Berry, Puyuan Peng, Hung-yi Lee, Hsin-Min Wang, and David Harwath, "SpeechCLIP+: Self-supervised multi-task representation learning for speech via CLIP and speech-image data," IEEE ICASSP 2024 Workshop: Self-supervision in Audio, Speech and Beyond, April 2024. ::: 42. Ryandhimas Zezario, Bo-Ren Brian Bai, Chiou-Shann Fuh, Hsin-Min Wang, and Yu Tsao, "Multi-Task Pseudo-Label Learning for Non-Intrusive Speech Quality Assessment Model," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2024), April 2024. ::: 43. Erica Cooper, Wen-Chin Huang, Yu Tsao, Hsin-Min Wang, Tomoki Toda, and Junichi Yamagishi, "The VoiceMOS Challenge 2023: Zero-shot Subjective Speech Quality Prediction for Multiple Domains," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2023), December 2023. ::: 44. Chi-Chang Lee, Hong-Wei Chen, Chu-Song Chen, Hsin-Min Wang, Tsung-Te Liu, and Yu Tsao, "LC4SV: A Denoising Framework Learning to Compensate for Unseen Speaker Verification Models," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2023), December 2023. ::: 45. Po-Kai Chen, Bing-Jhih Huang, Chi-Tao Chen, Hsin-Min Wang and Jia-Ching Wang, "Enhancing Automatic Speech Recognition Performance Through Multi-Speaker Text-to-Speech," The 35th ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2023), October 2023. ::: 46. Ryandhimas E. Zezario, Chiou-Shann Fuh, Hsin-Min Wang, Yu Tsao, "Deep Learning-based Speech Intelligibility Prediction Model by Incorporating Whisper for Hearing Aids," The 4th Clarity Workshop on Machine Learning Challenges for Hearing Aids (Clarity-2023), August 2023. ::: 47. Hsin-Hao Chen, Yung-Lun Chien, Ming-Chi Yen, Shu-Wei Tsai, Yu Tsao, Tai-shih Chi, and Hsin-Min Wang, "Mandarin Electrolaryngeal Speech Voice Conversion using Cross-domain Features," Interspeech2023, August 2023. ::: 48. Li-Wei Chen, Yao-Fei Cheng, Hung-Shin Lee, Yu Tsao, and Hsin-Min Wang, "A Training and Inference Strategy Using Noisy and Enhanced Speech as Target for Speech Enhancement without Clean Speech," Interspeech2023, August 2023. ::: 49. Yung-Lun Chien, Hsin-Hao Chen, Ming-Chi Yen, Shu-Wei Tsai, Hsin-Min Wang, Yu Tsao, and Tai-Shih Chi, "Audio-Visual Mandarin Electrolaryngeal Speech Voice Conversion," Interspeech2023, August 2023. ::: 50. Chi-Chang Lee, Yu Tsao, Hsin-Min Wang, Chu-Song Chen, "D4AM: A General Denoising Framework for Downstream Acoustic Models," The Eleventh International Conference on Learning Representations, ICLR 2023, May 2023. 51. Hung-Shin Lee, Pin-Yuan Chen, Yao-Fei Cheng, Yu Tsao and Hsin-Min Wang, "Speech-enhanced and Noise-aware Networks for Robust Speech Recognition," International Symposium on Chinese Spoken Language Processing (ISCSLP2022), December 2022. ::: 52. Shih-Kuang Lee, Yu Tsao, and Hsin-Min Wang, "Detecting Replay Attacks Using Single-Channel Audio: The Temporal Autocorrelation of Speech," APSIPA Annual Summit and Conference (APSIPA ASC 2022), November 2022. ::: 53. Yun-Ju Chan, Chiang-Jen Peng, Syu-Siang Wang, Hsin-Min Wang, Yu Tsao, and Tai-Shih Chi, "Speech Enhancement-Assisted Voice Conversion in Noisy Environments," APSIPA Annual Summit and Conference (APSIPA ASC 2022), November 2022. ::: 54. Yin-Ping Cho, Yu Tsao, Hsin-Min Wang, and Yi-Wen Liu, "Mandarin Singing Voice Synthesis with Denoising Diffusion Probabilistic Wasserstein GAN," APSIPA Annual Summit and Conference (APSIPA ASC 2022), November 2022. ::: 55. Ammarah Hashmi, Sahibzada Adil Shahzad, Chia-Wen Lin, Yu Tsao, and Hsin-Min Wang, "Multimodal Forgery Detection Using Ensemble Learning," APSIPA Annual Summit and Conference (APSIPA ASC 2022), November 2022. ::: 56. Sahibzada Adil Shahzad, Ammarah Hashmi,Sarwar Khan, Yan-Tsung Peng, Yu Tsao, and Hsin-Min Wang, "Lip Sync Matters: A Novel Multimodal Forgery Detector," APSIPA Annual Summit and Conference (APSIPA ASC 2022), November 2022. ::: 57. Aleksandra Smolka, Hsin-Min Wang, Jason S. Chang and Keh-Yih Su, "Is Character Trigram Overlapping Ratio Still the Best Similarity Measure for Aligning Sentences in a Paraphrased Corpus?," The 34th ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2022), November 2022, (Best Paper Award) ::: 58. Shang-Bao Luo, Hsin-Min Wang, Kuan-Yu Chen, Keh-Yih Su, Yu Tsao and Cheng-Chung Fan, "Chinese Movie Dialogue Question Answering Dataset," The 34th ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2022), November 2022, (in Chinese) ::: 59. Hung-Shin Lee, Pin-Tuan Huang, Yao-Fei Cheng and Hsin-Min Wang, "Chain-based Discriminative Autoencoders for Speech Recognition," Interspeech2022, September 2022. ::: 60. Ryandhimas Edo Zezario, Szu-wei Fu, Fei Chen, Chiou-Shann Fuh, Hsin-Min Wang and Yu Tsao, "MTI-Net: A Multi-Target Speech Intelligibility Prediction Model," Interspeech2022, September 2022. ::: 61. Wen Chin Huang, Erica Cooper, Yu Tsao, Hsin-Min Wang, Tomoki Toda and Junichi Yamagishi, "The VoiceMOS Challenge 2022," Interspeech2022, September 2022. ::: 62. Fan-Lin Wang, Hung-Shin Lee, Yu Tsao and Hsin-Min Wang, "Disentangling the Impacts of Language and Channel Variability on Speech Separation Networks," Interspeech2022, September 2022. ::: 63. Ryandhimas Edo Zezario, Fei Chen, Chiou-Shann Fuh, Hsin-Min Wang and Yu Tsao, "MBI-Net: A Non-Intrusive Multi-Branched Speech Intelligibility Prediction Model for Hearing Aids," Interspeech2022, September 2022. ::: 64. Chi-Chang Lee, Cheng-Hung Hu, Yu-Chen Lin, Chu-Song Chen, Hsin-Min Wang, Yu Tsao, "NASTAR: Noise Adaptive Speech Enhancement with Target-Conditional Resampling," Interspeech 2022, September 2022. ::: 65. Chiang-Lin Tai, Hung-Shin Lee, Yu Tsao, Hsin-Min Wang, "Filter-based Discriminative Autoencoders for Children Speech Recognition," EUSIPCO2022, August 2022. ::: 66. Kuan-Chen Wang, Kai-Chun Liu, Hsin-Min Wang, and Yu Tsao, "EMGSE: Acoustic/EMG Fusion for Multimodal Speech Enhancement," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2022), May 2022. ::: 67. Haibin Wu, Heng-Cheng Kuo, Naijun Zheng, Kuo-Hsuan Hung, Hung-yi Lee, Yu Tsao, Hsin-Min Wang, Helen Meng, "Partially Fake Audio Detection by Self-attention-based Fake Span Discovery," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2022), May 2022, arXiv:2202.06684 ::: 68. Yi-Syuan Liou, Wen-Chin Huang, Ming-Chi Yen, Shu-Wei Tsai, Yu-Huai Peng, Tomoki Toda, Yu Tsao, and Hsin-Min Wang, "Time Alignment Using Lip Images for Frame-Based Electrolaryngeal Voice Conversion," APSIPA Annual Summit and Conference (APSIPA ASC 2021), December 2021. ::: 69. Yu-Huai Peng, Hung-Shin Lee, Pin-Tuan Huang, and Hsin-Min Wang, "Generation of Speaker Representations Using Heterogeneous Training Batch Assembly," APSIPA Annual Summit and Conference (APSIPA ASC 2021), December 2021. ::: 70. Ming-Chi Yen, Wen-Chin Huang, Kazuhiro Kobayashi, Yu-Huai Peng, Shu-Wei Tsai, Yu Tsao, Tomoki Toda, Jyh-Shing Jang, and Hsin-Min Wang, "Mandarin Electrolaryngeal Speech Voice Conversion with Sequence-to-Sequence Modeling," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2021), December 2021. ::: 71. Hsin-Tien Chiang, Yi-Chiao Wu, Cheng Yu, Tomoki Toda, Hsin-Min Wang, Yih-Chun Hu, and Yu Tsao, "HASA-NET: A Non-Intrusive Hearing-Aid Speech Assessment Network," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2021), December 2021. ::: 72. Qian-Bei Hong, Chung-Hsien Wu, Thanh Binh Nguyen, and Hsin-Min Wang, "Improvement of Spatial Ambiguity in Multi-Channel Speech Separation Using Channel Attention," APSIPA Annual Summit and Conference (APSIPA ASC 2021), December 2021. ::: 73. Yi-Wei Chen, Hung-Shin Lee, Yen-Hsing Chen, and Hsin-Min Wang, "SurpriseNet: Melody Harmonization Conditioning on User-controlled Surprise Contours," ISMIR2021, November 2021. ::: 74. Md Mahbub E Noor, Yen-Ju Lu, Syu-Siang Wang, Supratip Ghose, Chia-Yu Chang, Ryandhimas E. Zezario, Shafique Ahmed, Wei-Ho Chung, Yu Tsao and Hsin-Min Wang, "Investigation of A Single-Channel Frequency-Domain Speech Enhancement Network to Improve End-To-End Bengali Automatic Speech Recognition Under Unseen Noisy Conditions," Oriental COCOSDA 2021: International Conference on Speech Databases and Assessments, November 2021. ::: 75. Shih-Hung Tsai, Chao-Chun Liang, Hsin-Min Wang, and Keh-Yih Su, "Mining Commonsense and Domain Knowledge from Math Word Problems," The 33rd ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2021), October 2021. ::: 76. Cheng-Chung Fan, Keh-Yih Su, Kuan-Yu Chen, Yu Tsao, Jia-Zhi Guo, Shang-Bao Luo, Pei-Jun Liao, Kuang-Yu Chang, Chiao-Wei Hsu, Meng-Tse Wu, Shih-Hong Tsai, Tzu-Man Wu, Aleksandra Smolka, Chao-Chun Liang, and Hsin-Min Wang, "A Flexible and Extensible Framework for Multiple Answer Modes Question Answering," The 33rd ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2021), October 2021. ::: 77. Fan-Lin Wang, Yu-Huai Peng, Hung-Shin Lee, and Hsin-Min Wang, "Dual-Path Filter Network: Speaker-Aware Modeling for Speech Separation," Interspeech2021, August 2021. ::: 78. Shih-hung Tsai, Chao-Chun Liang, Hsin-Min Wang, and Keh-Yih Su, "Sequence to General Tree: Knowledge-Guided Geometry Word Problem Solving," ACL-IJCNLP2021, August 2021. ::: 79. Ryandhimas Zezario, Chiou-Shann Fuh, Hsin-Min Wang, and Yu Tsao, "Speech Enhancement with Zero-Shot Model Selection," EUSIPCO2021, August 2021. ::: 80. Yao-Fei Cheng, Hung-Shin Lee, and Hsin-Min Wang, "AlloST: Low-resource Speech Translation without Source Transcription," Interspeech2021, August 2021. ::: 81. Wen-Chin Huang, Kazuhiro Kobayashi, Yu-Huai Peng, Ching-Feng Liu, Yu Tsao, Hsin-Min Wang, and Tomoki Toda, "A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker Identity in Dysarthric Voice Conversion," Interspeech2021, August 2021. ::: 82. Yi-Chiao Wu, Cheng-Hung Hu, Hung-Shin Lee, Yu-Huai Peng, Wen-Chin Huang, Yu Tsao, Hsin-Min Wang, and Tomoki Toda, "Relational Data Selection for Data Augmentation of Speaker-dependent Multi-band MelGAN Vocoder," Interspeech2021, August 2021. ::: 83. Chung-En Sun, Yi-Wei Chen, Hung-Shin Lee, Yen-Hsing Chen, and Hsin-Min Wang, "Melody Harmonization Using Orderless NADE, Chord Balancing, and Blocked Gibbs Sampling," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2021), June 2021. ::: 84. Wen-Chin Huang, Chia-Hua Wu, Shang-Bao Luo, Kuan-Yu Chen, Hsin-Min Wang, and Tomoki Toda, "Speech Recognition by Simply Fine-Tuning BERT," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2021), June 2021. ::: 85. Yu-Tao Chang, Yuan-Hong Yang, Yu-Huai Peng, Syu-Siang Wang, Tai-Shih Chi, Yu Tsao, and Hsin-Min Wang, "MoEVC: A Mixture of Experts Voice Conversion System With Sparse Gating Mechanism for Online Computation Acceleration," International Symposium on Chinese Spoken Language Processing (ISCSLP2021), January 2021. ::: 86. Ryandhimas E. Zezario, Szu-Wei Fu, Chiou-Shann Fuh, Yu Tsao, and Hsin-Min Wang, "STOI-Net: A Deep Learning based Non-Intrusive Speech Intelligibility Assessment Model," APSIPA Annual Summit and Conference (APSIPA ASC 2020), December 2020. ::: 87. Hao Yen, Pin-Jui Ku, Ming-Chi Yen, Hung-Shin Lee, and Hsin-Min Wang, "Joint Training of Guided Learning and Mean Teacher Models for Sound Event Detection," The 5th Workshop on Detection and Classification of Acoustic Scenes and Events (DCASE2020), November 2020. ::: 88. Pin-Yuan Chen, Chia-Hua Wu, Hung-Shin Lee, Shao-Kang Tsao, Ming-Tat Ko, and Hsin-Min Wang, "Using Taigi Dramas with Mandarin Chinese Subtitles to Improve Taigi Speech Recognition," Oriental COCOSDA 2020: International Conference on Speech Databases and Assessments, November 2020. ::: 89. Yu-Huai Peng, Cheng-Hung Hu, Alexander Kang, Hung-Shin Lee, Pin-Yuan Chen, Yu Tsao and Hsin-Min Wang, "The Academia Sinica Systems of Voice Conversion for VCC2020," Joint Workshop for the Blizzard Challenge and Voice Conversion Challenge 2020, October 2020. ::: 90. Shang-Yi Chuang, Yu Tsao, Chen-Chou Lo, and Hsin-Min Wang, "Lite Audio-Visual Speech Enhancement," Interspeech2020, October 2020. ::: 91. Chi-Chang Lee, Yu-Chen Lin, Hsuan-Tien Lin, Hsin-Min Wang, and Yu Tsao, "SERIL: Noise Adaptive Speech Enhancement using Regularization-based Incremental Learning," Interspeech2020, October 2020. ::: 92. Qian-Bei Hong, Chung-Hsien Wu, Hsin-Min Wang, and Chien-Lin Huang, "Combining Deep Embeddings of Acoustic and Articulatory Features for Speaker Identification," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2020), May 2020. ::: 93. Hung-Shin Lee, Yu-Huai Peng, Pin-Tuan Huang, Ying-Chun Tseng, Chia-Hua Wu, Yu Tsao, and Hsin-Min Wang, "The Academia Sinica Systems of Speech Recognition and Speaker Diarization for the CHiME-6 Challenge," The 6th International Workshop on Speech Processing in Everyday Environments (CHiME 2020), May 2020. ::: 94. Ryandhimas Edo Zezario, Tassadaq Hussain, Xugang Lu, Hsin-Min Wang, and Yu Tsao, "Self-Supervised Denoising Autoencoder with Linear Regression Decoder for Speech Enhancement," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2020), May 2020. ::: 95. Qian-Bei Hong, Chung-Hsien Wu, Hsin-Min Wang, and Chien-Lin Huang, "Statistics Pooling Time Delay Neural Network Based on X-Vector for Speaker Verification," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2020), May 2020. ::: 96. Shang-Bao Luo, Hung-Shin Lee, Kuan-Yu Chen, Hsin-Min Wang, "Spoken Multiple-Choice Question Answering Using Multimodal Convolutional Neural Networks," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2019), December 2019. ::: 97. Hsiao-Tzu Hung, Chung-Yang Wang, Yi-Hsuan Yang and Hsin-Min Wang, "Improving Automatic Jazz Melody Generation by Transfer Learning Techniques," APSIPA Annual Summit and Conference (APSIPA ASC 2019), November 2019. ::: 98. Wei-Cheng Lin, Yu Tsao, Hsin-Min Wang and Fei Chen, "Investigation of Neural Network Approaches for Unified Spectral and Prosodic Feature Enhancement," APSIPA Annual Summit and Conference (APSIPA ASC 2019), November 2019. ::: 99. Qian-Bei Hong, Chung-Hsien Wu, Ming-Hsiang Su and Hsin-Min Wang, "Sequential Speaker Embedding and Transfer Learning for Text-Independent Speaker Identification," APSIPA Annual Summit and Conference (APSIPA ASC 2019), November 2019. ::: 100. Yueh-Ting Lee, Xuan-Bo Chen, Hung-Shin Lee, Jyh-Shing Roger Jang and Hsin-Min Wang, "Multi-task Learning for Mandarin Acoustic Modeling Using Articulatory Attributes," APSIPA Annual Summit and Conference (APSIPA ASC 2019), November 2019. ::: 101. Tassadaq Hussain, Yu Tsao, Hsin-Min Wang, Jia-Ching Wang, Sabato Marco Siniscalchi and Wen-Hung Liao, "Compressed Multimodel Hierarchical Extreme Learning Machine for Speech Enhancement," APSIPA Annual Summit and Conference (APSIPA ASC 2019), November 2019. ::: 102. Xuan-Bo Chen, Yueh-Ting Lee, Hung-Shin Lee, Jyh-Shing Roger Jang, and Hsin-Min Wang, "Mandarin Mispronunciation Detection and Diagnosis Feedback Using Articulatory Attributes Based Multi-task Learning," Oriental COCOSDA 2019: International Conference on Speech Databases and Assessments, October 2019. ::: 103. Kuan-Yi Kang, Yi-Wen Liu, and Hsin-Min Wang, "Influences of Prosodic Feature Replacement on the Perceived Singing Voice Identity," The 31st ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2019), October 2019. ::: 104. Wen-Chin Huang, Yi-Chiao Wu, Hsin-Te Hwang, Patrick Lumban Tobing, Tomoki Hayashi, Kazuhiro Kobayashi, Tomoki Toda, Yu Tsao, and Hsin-Min Wang, "Refined WaveNet Vocoder for Variational Autoencoder Based Voice Conversion," EUSIPCO2019, September 2019. ::: 105. Wen-Chin Huang, Yi-Chiao Wu, Kazuhiro Kobayashi, Yu-Huai Peng, Hsin-Te Hwang, Patrick Lumban Tobing, Yu Tsao, Hsin-Min Wang, and Tomoki Toda, "Generalization of Spectrum Differential based Direct Waveform Modification for Voice Conversion," 10th ISCA Speech Synthesis Workshop, September 2019. ::: 106. Pin-Tuan Huang, Hung-Shin Lee, Syu-Siang Wang, Kuan-Yu Chen, Yu Tsao, Hsin-Min Wang, "Exploring the Encoder Layers of Discriminative Autoencoders for LVCSR," Interspeech2019, September 2019, (Student Travel Grant) ::: 107. Ryandhimas Edo Zezario, Szu-wei Fu, Xugang Lu, Hsin-Min Wang and Yu Tsao, "Specialized Speech Enhancement Model Selection Based on Learned Non-Intrusive Quality Assessment Metric," Interspeech2019, September 2019. ::: 108. Chen-Chou Lo, Szu-Wei Fu, Wen-Chin Huang, Xin Wang, Junichi Yamagishi, Yu Tsao, Hsin-Min Wang, "MOSNet: Deep Learning based Objective Assessment for Voice Conversion," Interspeech2019, September 2019. ::: 109. Tassadaq Hussain, Yu Tsao, Hsin-Min Wang, Jia-Ching Wang, Sabato Marco Siniscalchi, and Wen-Hung Liao, "Audio-Visual Speech Enhancement using Hierarchical Extreme Learning Machine," EUSIPCO2019, September 2019. ::: 110. Wen-Chin Huang, Yi-Chiao Wu, Chen-Chou Lo, Patrick Lumban Tobing, Tomoki Hayashi, Kazuhiro Kobayashi, Tomoki Toda, Yu Tsao, Hsin-Min Wang, "Investigation of F0 conditioning and Fully Convolutional Networks in Variational Autoencoder based Voice Conversion," Interspeech2019, September 2019, (Student Travel Grant) ::: 111. Chien-Feng Liao, Yu Tsao, Hung-Yi Lee, Hsin-Min Wang, "Noise Adaptive Speech Enhancement using Domain Adversarial Training," Interspeech2019, September 2019, (Student Travel Grant) ::: 112. Yih-Liang Shen, Chao-Yuan Huang, Syu-Siang Wang, Yu Tsao, Hsin-Min Wang, and Tai-Shih Chi, "Reinforcement Learning based Speech Enhancement for Robust Speech Recognition," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2019), May 2019. ::: 113. Tassadaq Hussain, Yu Tsao, Sabato Marco Siniscalchi, Jia-Ching Wang, Hsin-Min Wang and Wen-Hung Liao, "Bone-conducted Speech Enhancement using Hierarchical Extreme Learning Machine," International Workshop on Spoken Dialogue Systems (IWSDS 2019), April 2019. ::: 114. Wen-Chin Huang, Hsin-Te Hwang, Yu-Huai Peng, Yu Tsao, and Hsin-Min Wang, "Voice Conversion Based on Cross-Domain Features Using Variational Auto Encoders," International Symposium on Chinese Spoken Language Processing (ISCSLP2018), November 2018, (Best Student Paper Award) ::: 115. Ryandhimas Edo Zezario, Jen-Wei Huang, Xugang Lu, Yu Tsao, Hsin-Te Hwang, Hsin-Min Wang, "Deep Denoising Autoencoder Based Post Filtering for Speech Enhancement," APSIPA Annual Summit and Conference (APSIPA ASC 2018), November 2018. ::: 116. Wen-Chin Huang, Chen-Chou Lo, Hsin-Te Hwang, Yu Tsao, and Hsin-Min Wang, "WaveNet Vocoder and its Applications in Voice Conversion," The 30th ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2018), October 2018, (in Chinese) ::: 117. Yi-Ying Kao, Hsiang-Ping Hsu, Chien-Feng Liao, Yu Tsao, Hao-Chun Yang, Jeng-Lin Li, Chi-Chun Lee, Hung-Shin Lee, and Hsin-Min Wang, "Automatic Detection of Speech Under Cold Using Discriminative Autoencoders and Strength Modeling with Multiple Sub-Dictionary Generation," International Workshop on Acoustic Signal Enhancement (IWAENC 2018), September 2018. ::: 118. Szu-wei Fu, Yu Tsao, Hsin-Te Hwang and Hsin-Min Wang, "Quality-Net: An End-to-End Non-intrusive Speech Quality Assessment Model based on BLSTM," Interspeech2018, September 2018, (Student Travel Grant) ::: 119. Yu-Huai Peng, Hsin-Te Hwang, Yi-Chiao Wu, Yu Tsao, and Hsin-Min Wang, "Exemplar-Based Spectral Detail Compensation for Voice Conversion," Interspeech2018, September 2018, (Student Travel Grant) ::: 120. Wen-Li Wei, Jen-Chun Lin, Tyng-Luh Liu, Yi-Hsuan Yang, Hsin-Min Wang, Hsiao-Rong Tyan, and Hong-Yuan Mark Liao, "Seethevoice: Learning from Music to Visual Storytelling of Shots," IEEE International Conference on Multimedia and Expo (ICME), July 2018. ::: 121. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen, and Hsin-Min Wang, "Essence Vector-based Query Modeling for Spoken Document Retrieval," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2018), April 2018. ::: 122. Ming-Hsiang Su, Chung-Hsien Wu, Kun-Yi Huang, Qian-Bei Hong and Hsin-Min Wang, "Personality Trait Perception from Speech Signals Using Multiresolution Analysis and Convolutional Neural Networks," APSIPA Annual Summit and Conference (APSIPA ASC 2017), December 2017. ::: 123. Tien-Hong Lo, Ying-Wen Chen, Kuan-Yu Chen, Hsin-Min Wang, and Berlin Chen, "Neural Relevance-Aware Query Modeling for Spoken Document Retrieval," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2017), December 2017. ::: 124. Yu-Huai Peng, Chin-Cheng Hsu, Yi-Chiao Wu, Hsin-Te Hwang, Yi-Wen Liu, Yu Tsao, and Hsin-Min Wang, "Fast Locally Linear Embedding Algorithm for Exemplar-based Voice Conversion," APSIPA Annual Summit and Conference (APSIPA ASC 2017), December 2017, (Best Poster Presentation Award) ::: 125. Jen-Chun Lin, Wen-Li Wei, James Yang, Hsin-Min Wang, and Hong-Yuan Mark Liao, "Automatic Music Video Generation Based on Simultaneous Soundtrack Recommendation and Video Editing," ACM Multimedia (MM), October 2017. ::: 126. Ying-Wen Chen, Kuan-Yu Chen, Hsin-Min Wang, and Berlin Chen, "Exploring the Use of Significant Words Language Modeling for Spoken Document Retrieval," Interspeech2017, August 2017. ::: 127. Yi-Chiao Wu, Hsin-Te Hwang, Syu-Siang Wang, Chin-Cheng Hsu, Yu Tsao, and Hsin-Min Wang, "A Post-filtering Approach Based on Locally Linear Embedding Difference Compensation for Speech Enhancement," Interspeech2017, August 2017. ::: 128. Ming-Han Yang, Hung-Shin Lee, Yu-Ding Lu, Kuan-Yu Chen, Yu Tsao, Berlin Chen, and Hsin-Min Wang, "Discriminative Autoencoders for Acoustic Modeling," Interspeech2017, August 2017. ::: 129. Chin-Cheng Hsu, Hsin-Te Hwang, Yi-Chiao Wu, Yu Tsao, and Hsin-Min Wang, "Voice Conversion from Unaligned Corpora Using Variational Autoencoding Wasserstein Generative Adversarial Networks," Interspeech2017, August 2017. ::: 130. Chia-Lung Wu, Hsiang-Ping Hsu, Syu-Siang Wang, Jeih-Weih Hung, Ying-Hui Lai, Hsin-Min Wang, and Yu Tsao, "Wavelet Speech Enhancement Based on Robust Principal Component Analysis," Interspeech2017, August 2017. ::: 131. Yi-Chiao Wu, Hsin-Te Hwang, Syu-Siang Wang, Chin-Cheng Hsu, Ying-Hui Lai, Yu Tsao, and Hsin-Min Wang, "A Locally Linear Embbeding Based Postfiltering Approach for Speech Enhancement," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2017), March 2017. ::: 132. Shih-Hung Liu, Kuan-Yu Chen, Berlin Chen, Hsin-Min Wang, and Wen-Lian Hsu, "Leveraging Manifold Learning for Extractive Broadcast News Summarization," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2017), March 2017. ::: 133. Hung-Shin Lee, Yu-Ding Lu, Chin-Cheng Hsu, Yu Tsao, Hsin-Min Wang, and Shyh-Kang Jeng, "Discriminative Autoencoders for Speaker Verification," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2017), March 2017. ::: 134. Po-Yuan Shih, Chia-Ping Chen, and Hsin-Min Wang, "Speech Emotion Recognition with Skew-Robust Neural Networks," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2017), March 2017. ::: 135. Wen-Li Wei, Jen-Chun Lin, Tyng-Luh Liu, Yi-Hsuan Yang, Hsin-Min Wang, Hsiao-Rong Tyan, and Hong-Yuan Mark Liao, "Deep-Net Fusion to Classify Shots in Concert Videos," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), March 2017. ::: 136. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen, and Hsin-Min Wang, "A Locality-Preserving Essence Vector Modeling Framework for Spoken Document Retrieval," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2017), March 2017. ::: 137. Jen-Cheng Hou, Syu-Siang Wang, Ying-Hui Lai, Jen-Chun Lin, Yu Tsao, Hsiu-Wen Chang, and Hsin-Min Wang, "Audio-Visual Speech Enhancement using Deep Neural Networks," APSIPA Annual Summit and Conference (APSIPA ASC), December 2016. ::: 138. Shih-Hung Liu, Kuan-Yu Chen, Yu-Lun Hsieh, Berlin Chen, Hsin-Min Wang, Hsu-Chun Yen and Wen-Lian Hsu, "Exploiting Graph Regularized Nonnegative Matrix Factorization for Extractive Speech Summarization," APSIPA Annual Summit and Conference (APSIPA ASC 2016), December 2016. ::: 139. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen and Hsin-Min Wang, "A Novel Paragraph Embedding Method for Spoken Document Summarization," APSIPA Annual Summit and Conference (APSIPA ASC 2016), December 2016. ::: 140. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen and Hsin-Min Wang, "Learning to Distill: The Essence Vector Modeling Framework," International Conference on Computational Linguistics (COLING2016), December 2016. ::: 141. Chin-Cheng Hsu, Hsin-Te Hwang, Yi-Chiao Wu, Yu Tsao and Hsin-Min Wang, "Voice Conversion from Non-parallel Corpora Using Variational Auto-encoder," APSIPA Annual Summit and Conference (APSIPA ASC 2016), December 2016. ::: 142. Chin-Cheng Hsu, Hsin-Te Hwang, Yi-Chiao Wu, Yu Tsao, and Hsin-Min Wang, "Dictionary Update for NMF-based Voice Conversion Using an Encoder-Decoder Network," International Symposium on Chinese Spoken Language Processing (ISCSLP2016), October 2016. ::: 143. Jen-Chun Lin, Wen-Li Wei, and Hsin-Min Wang, "Automatic Music Video Generation Based on Emotion-Oriented Pseudo Song Prediction and Matching," ACM Multimedia (MM), October 2016. ::: 144. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen, Hsin-Min Wang, and Hsin-Hsi Chen, "Novel Word Embedding and Translation-based Language Modeling for Extractive Speech Summarization," ACM Multimedia Conference 2016, October 2016, (SHORT PAPER, acceptance rate = 30%) ::: 145. Yu-Lun Hsieh, Shih-Hung Liu, Kuan-Yu Chen, Hsin-Min Wang, Wen-Lian Hsu, and Berlin Chen, "Exploiting Sequence-to-Sequence Generation Framework for Automatic Abstractive Summarization," The 28th ROCLING Conference on Computational Linguistics and Speech Processing (ROCLING2016), October 2016, (in Chinese) ::: 146. Hung-Shin Lee, Yu Tsao, Chi-Chun Lee, Hsin-Min Wang, Wei-Cheng Lin, Wei-Chen Chen, Shan-Wen Hsiao, and Shyh-Kang Jeng, "Minimization of Regression and Ranking Losses with Shallow Neural Networks on Automatic Sincerity Evaluation," Interspeech2016, September 2016. ::: 147. Shih-Hung Liu, Kuan-Yu Chen, Yu-Lun Hsieh, Berlin Chen, Hsin-Min Wang, Hsu-Chun Yen, and Wen-Lian Hsu, "Exploring Word Mover’s Distance and Semantic-Aware Embedding Techniques for Extractive Broadcast News Summarization," Interspeech2016, September 2016. ::: 148. Yi-Chiao Wu, Hsin-Te Hwang, Chin-Cheng Hsu, Yu Tsao, and Hsin-Min Wang, "Locally Linear Embedding for Exemplar-Based Spectral Conversion," Interspeech2016, September 2016. ::: 149. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen, and Hsin-Min Wang, "Improved Spoken Document Summarization with Coverage Modeling Techniques," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2016), March 2016. ::: 150. Jen-Chun Lin, Wen-Li Wei, and Hsin-Min Wang, "DEMV-Matchmaker: Emotional Temporal Course Representation and Deep Similarity Matching for Automatic Music Video Generation," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), March 2016. ::: 151. Kuan-Yu Chen, Kai-Wun Shih, Shih-Hung Liu, Berlin Chen, and Hsin-Min Wang, "Incorporating Paragraph Embeddings and Density Peaks Clustering for Spoken Document Summarization," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2015), December 2015. ::: 152. Shih-Hung Liu, Hung-Shin Lee, Hsiao-Tsung Hung, Kuan-Yu Chen, Berlin Chen, Hsin-Min Wang, Hsu-Chun Yen, Wen-Lian Hsu, "Incorporating proximity information in relevance language modeling for extractive speech summarization," APSIPA Annual Summit and Conference (APSIPA ASC 2015), Hong Kong, December 2015. ::: 153. Syu-Siang Wang, Hsin-Te Hwang, Ying-Hui Lai, Yu Tsao, Xugang Lu, Hsin-Min Wang and Borching Su, "Improving Denoising Auto-encoder Based Speech Enhancement With the Speech Parameter Generation Algorithm," APSIPA Annual Summit and Conference (APSIPA ASC 2015), December 2015. ::: 154. Hsin-Te Hwang, Yu Tsao, Hsin-Min Wang, Yih-Ru Wang and Sin-Horng Chen, "A Probabilistic Interpretation for Artificial Neural Network-based Voice Conversion," APSIPA Annual Summit and Conference (APSIPA ASC 2015), December 2015. ::: 155. Jen-Chun Lin, Wen-Li Wei, and Hsin-Min Wang, "EMV-matchmaker: Emotional Temporal Course Modeling and Matching for Automatic Music Video Generation," ACM Multimedia (ACM MM), October 2015. ::: 156. Kuan-Yu Chen, Shih-Hung Liu, Hsin-Min Wang, Berlin Chen and Hsin-Hsi Chen, "Leveraging Word Embeddings for Spoken Document Summarization," Interspeech2015, September 2015. ::: 157. Shih-Hung Liu, Kuan-Yu Chen, Berlin Chen, Hsin-Min Wang, Hsu-Chun Yen and Wen-Lian Hsu, "Positional language modeling for extractive broadcast news speech summarization," Interspeech2015, September 2015. ::: 158. Kuan-Yu Chen, Hsin-Min Wang, Berlin Chen, and Hsin-Hsi Chen, "I-Vector based Language Modeling for Query Representation," The 40th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2015), April 2015, (IEEE SPS Travel Grant) ::: 159. Ju-Chiang Wang, Hsin-Min Wang, and Gert Lanckriet, "A Histogram Density Modeling Approach to Music Emotion Recognition," IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2015), April 2015. ::: 160. Shih-Hung Liu, Kuan-Yu Chen, Berlin Chen, Ea-Ee Jan, Hsin-Min Wang, Hsu-Chun Yen, and Wen-Lian Hsu, "A Margin-based Discriminative Modeling Approach for Extractive Speech Summarization," APSIPA Annual Summit and Conference (APSIPA ASC 2014), December 2014. ::: 161. Jen-Chun Lin, Wen-Li Wei, Chung-Hsien Wu, and Hsin-Min Wang, "Emotion Recognition of Conversational Affective Speech Using Temporal Course Modeling-Based Error Weighted Cross-Correlation Model," APSIPA Annual Summit and Conference (APSIPA ASC), December 2014. ::: 162. Ju-Chiang Wang, Ming-Chi Yen, Yi-Hsuan Yang, and Hsin-Min Wang, "Automatic Set List Identification and Song Segmentation of Full-Length Concert Videos," International Society for Music Information Retrieval Conference (ISMIR2014), October 2014. ::: 163. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen, Ea-Ee Jan, Hsin-Min Wang, Wen-Lian Hsu, and Hsin-Hsi Chen, "Leveraging Effective Query Modeling Techniques for Speech Recognition and Summarization," Conference on Empirical Methods in Natural Language Processing (EMNLP 2014), Doha, Qatar, October 2014. ::: 164. Shih-Hung Liu, Kuan-Yu Chen, Yu-Lun Hsieh, Hsin-Min Wang, Wen-Lian Hsu, and Berlin Chen, "Investigating Novel Sentence Modeling Techniques for Extractive Speech Summarization," The 26th ROCLING Conference on Computational Linguistics and Speech Processing, September 2014. ::: 165. How Jing, Ting-Yao Hu, Hung-Shin Lee, Wei-Chen Chen, Chi-Chun Lee, Yu Tsao, and Hsin-Min Wang, "Ensemble of Machine Learning Algorithms for Cognitive and Physical Speaker Load Detection," Interspeech2014, September 2014. ::: 166. Shih-Hung Liu, Kuan-Yu Chen, Yu-Lun Hsieh, Berlin Chen, Hsin-Min Wang, Hsu-Chun Yen, and Wen-Lian Hsu, "Enhanced Language Modeling for Extractive Speech Summarization with Sentence Relatedness Information," Interspeech2014, September 2014. ::: 167. Hung-Shin Lee, Yu Tsao, Hsin-Min Wang, and Shyh-Kang Jen, "Clustering-Based I-Vector Formulation for Speaker Recognition," Interspeech2014, September 2014. ::: 168. Kuan-Yu Chen, Shih-Hung Liu, Berlin Chen, Hsin-Min Wang, Wen-Lian Hsu, and Hsin-Hsi Chen, "A Recurrent Neural Network Language Modeling Framework for Extractive Speech Summarization," IEEE International Conference on Multimedia & Expo (ICME 2014), July 2014, (acceptance rate: 29.7%) ::: 169. Shuo-Yang Wang, Ju-Chiang Wang, Yi-Hsuan Yang and Hsin-Min Wang, "Towards Time-varying Music Auto-tagging Based on CAL500 Expansion," IEEE International Conference on Multimedia and Expo (ICME2014), July 2014. ::: 170. Shih-Hung Liu, Kuan-Yu Chen, Yu-Lun Hsieh, Berlin Chen, Hsin-Min Wang, Hsu-Chun Yen, Wen-Lian Hsu, "Effective pseudo-relevance feedback for language modeling in extractive speech summarization," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2014), Florence,Italy, May 2014. ::: 171. Hung-Shin Lee, Yu Tsao, Yun-Fan Chang, Hsin-Min Wang, and Shyh-Kang Jeng, "Speaker Verification Using Kernel-Based Binary Classifiers with Binary Operation Derived Features," The 39th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2014), May 2014. ::: 172. Kuan-Yu Chen, Hung-Shin Lee, Hsin-Min Wang, Berlin Chen, and Hsin-Hsi Chen, "I-vector Based Language Modeling for Spoken Document Retrieval," The 39th IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2014), May 2014, (IEEE Spoken Language Processing Student Grant) ::: 173. Chin-Chia M. Yeh, Ju-Chiang Wang, Yi-Hsuan Yang and Hsin-Min Wang, "Improving music auto-tagging by intra-song instance bagging," IEEE Int. Conf. Acoustics, Speech and Signal Processing (ICASSP2014), May 2014. ::: 174. Hsin-Te Hwang, Yu Tsao, Hsin-Min Wang, Yih-Ru Wang, Sin-Horng Chen, "Incorporating Global Variance in the Training Phase of GMM-based Voice Conversion," APSIPA Annual Summit and Conference (APSIPA ASC 2013), October 2013. ::: 175. Shih-Hung Liu, Kuan-Yu Chen, Hsin-Min Wang, Wen-Lian Hsu, and Berlin Chen, "Improved Sentence Modeling Techniques for Extractive Speech Summarization," The 25th ROCLING Conference on Computational Linguistics and Speech Processing, October 2013, (in Chinese) (best paper award) ::: 176. Kuan-Yu Chen, Hung-Shin Lee, Chung-Han Lee, Hsin-Min Wang, and Hsin-Hsi Chen, "A Study of Language Modeling for Chinese Spelling Check," The Seventh SIGHAN Workshop on Chinese Language Processing (SIGHAN2013), October 2013. ::: 177. Zhonghua Li, Ju-Chiang Wang, Jingli Cai, Zhiyan Duan, Hsin-Min Wang and Ye Wang, "Non-Reference Audio Quality Assessment for Online Live Music Recordings," ACM Multimedia Conference (ACMMM2013), October 2013, (FULL PAPER) ::: 178. How Jing, Yu Tsao, Kuan-Yu Chen, and Hsin-Min Wang, "Semantic Naive Bayes Classifier for Document Classification," International Joint Conference on Natural Language Processing (IJCNLP2013), October 2013. ::: 179. Hsin-Te Hwang, Yu Tsao, Hsin-Min Wang, Yih-Ru Wang, and Sin-Horng Chen, "Alleviating the Over-Smoothing Problem in GMM-Based Voice Conversion with Discriminative Training," Interspeech2013, August 2013. ::: 180. Kuan-Yu Chen, Hsin-Min Wang, Berlin Chen, and Hsin-Hsi Chen, "Weighted Matrix Factorization for Spoken Document Retrieval," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2013), May 2013. ::: 181. Hung-Shin Lee, Yu-Chin Shih, Hsin-Min Wang, and Shyh-Kang Jeng, "Subspace-based Phonotactic Language Recognition Using Multivariate Dynamic Linear Models," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2013), May 2013. ::: 182. Yi-Wen Chen, Kuan-Yu Chen, Hsin-Min Wang, and Berlin Chen, "Effective Pseudo-Relevance Feedback for Spoken Document Retrieval," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2013), May 2013. ::: 183. Meng-Sung Wu, Chia-Ping Chen, and Hsin-Min Wang, "Query-document Relevance Topic Models," The 17th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD2013), Lecture Notes in Artificial Intelligence, 7819, pages 209-220, April 2013. ::: 184. Ju-Chiang Wang, Yi-Hsuan Yang, Hsin-Min Wang and Shyh-Kang Jeng, "Personalized Music Emotion Recognition via Model Adaptation," APSIPA Annual Summit and Conference (ASC), December 2012. 185. Hsin-Te Hwang, Yu Tsao, Hsin-Min Wang, Yih-Ru Wang, and Sin-Horng Chen, "Exploring Mutual Information for GMM-Based Spectral Conversion," International Symposium on Chinese Spoken Language Processing (ISCSLP2012), December 2012. ::: 186. Meng-Sung Wu and Hsin-Min Wang, "Term Relevance Dependency Model for Text Classification," International Conference on Pattern Recognition (ICPR2012), November 2012. ::: 187. Ju-Chiang Wang, Yi-Hsuan Yang, Kaichun Chang, Hsin-Min Wang, Shyh-Kang Jeng, "Exploring the Relationship between Categorical and Dimensional Emotion Semantics of Music," Proc. ACM Workshop on Music Information Retrieval with User-Centered and Multimodal Strategies (MIRUM), in conjunction with ACM Multimedia, November 2012. 188. Ju-Chiang Wang, Yi-Hsuan Yang, Hsin-Min Wang, and Shyh-Kang Jeng, "The Acoustic Emotion Gaussians Model for Emotion-Based Music Annotation and Retrieval," ACM Multimedia Conference (ACMMM2012), October 2012, (FULL PAPER, acceptance rate=20.2%) ::: 189. Ju-Chiang Wang, Yi-Hsuan Yang, I-Hong Jhuo, Yen-Yu Lin and Hsin-Min Wang, "The Acousticvisual Emotion Gaussians Model for Automatic Generation of Music Video," Proc. ACM International Conference on Multimedia (MM), October 2012, (Multimedia Grand Challenge FIRST PRIZE) ::: 190. Hsin-Te Hwang, Yu Tsao, Hsin-Min Wang, Yih-Ru Wang and Sin-Horng Chen, "A Study of Mutual Information for GMM-Based Spectral Conversion," Interspeech2012, September 2012. ::: 191. Kuan-Yu Chen, Hao-Chin Chang, Berlin Chen and Hsin-Min Wang, "Word Relevance Modeling for Speech Recognition," Interspeech2012, September 2012. ::: 192. Yu-Chin Shih, Hung-Shin Lee, Hsin-Min Wang, and Shyh-Kang Jeng, "Subspace-Based Feature Representation and Learning for Language Recognition," Interspeech2012, September 2012. ::: 193. Yu-Ren Chien, Hsin-Min Wang, and Shyh-Kang Jeng, "Simulated Formant Modeling of Accompanied Singing Signals for Vocal Melody Extraction," The 9th Sound and Music Computing Conference (SMC2012), July 2012. ::: 194. Meng-Sung Wu and Hsin-Min Wang, "A Term Association Translation Model for Naive Bayes Text Classification," Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD2012), Lecture Notes in Artificial Intelligence, 7301, May 2012. ::: 195. Ju-Chiang Wang, Hsin-Min Wang, and Shyh-Kang Jeng, "Playing with Tagging: A Real-Time Tagging Music Player," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2012), March 2012. ::: 196. Hung-Yi Lo, Shou-De Lin, and Hsin-Min Wang, "Generalized k-Labelset Ensemble for Multi-label Classification," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP2012), March 2012. ::: 197. Ju-Chiang Wang, Meng-Sung Wu, Hsin-Min Wang and Shyh-Kang Jeng, "Music Tag Annotation and Clustering Using Latent Music Semantic Analysis," Proc. the International Workshop on Computer Music and Audio Technology (WOCMAT), December 2011. 198. Ju-Chiang Wang, Yu-Chin Shih, Meng-Sung Wu, Hsin-Min Wang and Shyh-Kang Jeng, "Colorizing Tags in Tag Cloud: A Novel Query-by-Tag Music Search System," Proc. ACM International Conference on Multimedia (MM), November 2011, (FULL PAPER) 199. Yu-Ren Chien, Hsin-Min Wang, and Shyh-Kang Jeng, "An Acoustic-Phonetic Approach to Vocal Melody Extraction," The 12th International Society for Music Information Retrieval Conference (ISMIR2011), October 2011. ::: 200. Ju-Chiang Wang, Hung-Shin Lee, Hsin-Min Wang, and Shyh-Kang Jeng, "Learning the Similarity of Audio Music in Bag-of-frames Representation from Tagged Music Data," The 12th International Society for Music Information Retrieval Conference (ISMIR2011), October 2011. ::: 201. Ju-Chiang Wang, Meng-Sung Wu, Hsin-Min Wang and Shyh-Kang Jeng, "A Content-based Music Search System Using Query by Multi-tags with Multi-levels of Preference," The 12th International Society for Music Information Retrieval Conference (ISMIR), October 2011. 202. Shih-Wei Sun, Yu-Chiang Frank Wang, Yao-Ling Hung, Chia-Ling Chang, Kuan-Chieh Chenb, Shih-Sian Cheng, Hsin-Min Wang, and Hong-Yuan Mark Liao, "Automatic Annotation of Web Videos," IEEE International Conference on Multimedia & Expo (ICME 2011), July 2011, (accepted as a top 15% paper) ::: 203. Hung-Yi Lo, Ju-Chiang Wang, Hsin-Min Wang, Shou-De Lin, "Cost-sensitive Stacking for Audio Tag Annotation and Retrieval," IEEE Int. Conf. Acoustics, Speech, Signal Processing (ICASSP2011), May 2011. ::: 204. Hung-Yi Lo, Shou-De Lin, and Hsin-Min Wang, "Audio Tag Annotation and Retrieval Using Tag Count Information," International Conference on MultiMedia Modeling (MMM2011), Lecture Notes in Computer Science, 6523, January 2011. ::: 205. Meng-Sung Wu, Hung-Shin Lee, and Hsin-Min Wang, "Exploiting Semantic Associative Information in Topic Modeling," IEEE Workshop on Spoken Language Technology (SLT2010), December 2010. ::: 206. Ju-Chiang Wang, Hung-Shin Lee, Shyh-Kang Jeng and Hsin-Min Wang, "Posterior Weighted Bernoulli Mixture Model for Music Tag Annotation and Retrieval," Proc. APSIPA Annual Submit and Conference (ASC), December 2010. 207. Ju-Chiang Wang, Hung-Yi Lo, Shyh-Kang Jeng and Hsin-Min Wang, "Audio Classification Using Semantic Transformation and Classifier Ensemble," Proc. The 6th International WOCMAT & New Media Conference (WOCMAT), November 2010. 208. Hung-Yi Lo and Hsin-Min Wang, "Phone Boundary Refinement Using Ranking Methods," International Symposium on Chinese Spoken Language Processing (ISCSLP2010), November 2010. ::: 209. Meng-Sung Wu and Hsin-Min Wang, "Semantic Associative Topic Models for Information Retrieval," The 2010 Conference on Technologies and Applications of Artificial Intelligence (TAAI 2010), November 2010, (in Chinese) ::: 210. Yi-Hsiang Chao, Wei-Ho Tsai and Hsin-Min Wang, "Speaker Verification Using Support Vector Machine with LLR-based Sequence Kernels," International Symposium on Chinese Spoken Language Processing (ISCSLP2010), November 2010. ::: 211. Chih-Yi Chiu, Wei-Ming Chang, Po-Chih Lin, Hsin-Min Wang, and Shi-Nine Yang, "Detecting Pitching Frames in Baseball Game Video Using Markov Random Walk," International Conference on Image Processing (ICIP2010), September 2010. ::: 212. Shih-Sian Cheng, I-Fan Chen, and Hsin-Min Wang, "Bayesian Speaker Recognition Using Gaussian Mixture Model and Laplace Approximation," Interspeech2010, September 2010. ::: 213. I-Fan Chen, Shih-Sian Cheng, and Hsin-Min Wang, "Phonetic Subspace Mixture Model for Speaker Diarization," Interspeech2010, September 2010. ::: 214. Hung-Shin Lee, Hsin-Min Wang, and Berlin Chen, "A Discriminative and Heteroscedastic Linear Feature Transformation for Multiclass Classification," International Conference on Pattern Recognition (ICPR2010), August 2010. ::: 215. Hung-Yi Lo, Ju-Chiang Wang, and Hsin-Min Wang, "Homogeneous Segmentation and Classifier Ensemble for Audio Tag Annotation and Retrieval," Proc. IEEE International Conference on Multimedia and Expo (ICME), July 2010. 216. Chih-Yi Chiu, Dimitrios Bountouridis, Ju-Chiang Wang, and Hsin-Min Wang, "Background music identification through content filtering and min-hash matching," IEEE Int. Conf. Acoustics, Speech, Signal Processing (ICASSP2010), March 2010. ::: 217. Jen-Wei Kuo, Pu-Jen Cheng, and Hsin-Min Wang, "Learning to Rank from Bayesian Decision Inference," ACM Conference on Information and Knowledge Management (CIKM2009), November 2009. ::: 218. Hsin-Min Wang and Berlin Chen, "Mandarin Chinese Broadcast News Retrieval and Summarization Using Probabilistic Generative Models," APSIPA ASC 2009, October 2009. ::: 219. Yu-Ren Chien and Hsin-Min Wang, "Vocality-Sensitive Melody Extraction from Popular Songs," APSIPA ASC 2009, October 2009. ::: 220. Shih-Sian Cheng, Chun-Han Tseng, Chia-Ping Chen, and Hsin-Min Wang, "Speaker Diarization Using Divide-and-Conquer," Interspeech2009, September 2009. ::: 221. I-Fan Chen and Hsin-Min Wang, "Articulatory Feature Asynchrony Analysis and Compensation in Detection-Based ASR," Interspeech 2009, September 2009. ::: 222. I-Fan Chen and Hsin-Min Wang, "An Investigation of Phonological Feature Systems Used in Detection-Based ASR," International Symposium on Chinese Spoken Language Processing (ISCSLP2008), December 2008. ::: 223. Yi-Hsiang Chao, Wei-Ho Tsai, and Hsin-Min Wang, "Discriminative Feedback Adaptation for GMM-UBM Speaker Verification," International Symposium on Chinese Spoken Language Processing (ISCSLP2008), December 2008. ::: 224. Hsin-Min Wang, Jen-Wei Kuo, and Hung-Yi Lo, "Towards A Phoneme Labeled Mandarin Chinese Speech Corpus," Oriental COCOSDA 2008: International Conference on Speech Databases and Assessments, November 2008. ::: 225. Chih-Yi Chiu and Hsin-Min Wang, "A Novel Video Matching Framework for Copy Detection," The 21th IPPR Conference on Computer Vision, Graphics and Image Processing (CVGIP2008), August 2008. ::: 226. Shih-Hsiang Lin, Yi-Ting Chen, Hsin-Min Wang, Berlin Chen, "A Comparative Study of Probabilistic Ranking Models for Spoken Document Summarization," IEEE Int. Conf. Acoustics, Speech, Signal Processing (ICASSP2008), March 2008. ::: 227. Shih-Sian Cheng, Hsin-Min Wang, Hsin-Chia Fu, "Bic-based Audio Segmentation by Divide-and-Conquer," IEEE Int. Conf. Acoustics, Speech, Signal Processing (ICASSP2008), March 2008. ::: 228. Yi-Ting Chen, Shih-Hsiang Lin, Hsin-min Wang, and Berlin Chen, "Spoken Document Summarization Using Relevant Information," IEEE Automatic Speech Recognition and Understanding Workshop (ASRU2007), December 2007. ::: 229. Shih-Sian Cheng, Hsin-Chia Fu, and Hsin-min Wang, "CEM, EM, and DAEM Algorithms for Learning Self-Organizing Maps," IEEE International Workshop on. Machine Learning for Signal Processing (MLSP2007), August 2007. ::: 230. Yi-Hsiang Chao, Wei-Ho Tsai, Shih-Sian Cheng, Hsin-min Wang, and Ruei-Chuan Chang, "Evolutionary Minimum Verification Error Learning of the Alternative Hypothesis Model for LLR-based Speaker Verification," Interspeech2007, August 2007. ::: 231. Yi-Ting Chen, Hsuan-Sheng Chiu, Hsin-min Wang and Berlin Chen, "A Unified Probabilistic Generative Framework for Extractive Spoken Document Summarization," Interspeech2007, August 2007. ::: 232. Jen-Wei Kuo, Hung-Yi Lo, and Hsin-min Wang, "Improved HMM/SVM Methods for Automatic Phoneme Segmentation," Interspeech2007, August 2007. ::: 233. Ping-Han Lee, Lu-Jong Chu, Yi-Ping Hung, Sheng-Wen Shih, Chu-Song Chen, and Hsin-min Wang, "Cascading Multimodal Verification Using Face, Voice and Iris Information," IEEE International Conference on Multimedia and Expo (ICME2007), July 2007. ::: 234. Yi-Hsiang Chao, Wei-Ho Tsai, Hsin-min Wang, Ruei-Chuan Chang, "Improved Methods For Characterizing The Alternative Hypothesis Using Minimum Verification Error Training For LLR-Based Speaker Verification," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2007), April 2007. ::: 235. Hung-Yi Lo and Hsin-min Wang, "Phonetic Boundary Refinement Using Support Vector Machine," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2007), April 2007. ::: 236. Wei-Ho Tsai and Hsin-min Wang, "Speaker Clustering Based on Minimum Rand Index," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2007), April 2007. ::: 237. Yi-Hsiang Chao, Hsin-min Wang and Ruei-Chuan Chang, "A Novel Alternative Hypothesis Characterization Using Kernel Classifiers for LLR-based Speaker Verification," International Symposium on Chinese Spoken Language Processing (ISCSLP2006), Lecture Notes in Artificial Intelligence, 4274, December 2006. ::: 238. Yi-Ting Chen, Suhan Yu, Hsin-min Wang and Berlin Chen, "Extractive Chinese Spoken Document Summarization Using Probabilistic Ranking Models," International Symposium on Chinese Spoken Language Processing (ISCSLP2006), Lecture Notes in Artificial Intelligence, 4274, December 2006. ::: 239. Jen-Wei Kuo and Hsin-min Wang, "A Minimum Boundary Error Framework for Automatic Phonetic Segmentation," International Symposium on Chinese Spoken Language Processing (ISCSLP2006), Lecture Notes in Artificial Intelligence, 4274, December 2006. ::: 240. Tzan-Hwei Chen, Berlin Chen and Hsin-min Wang, "On Using Entropy Information to Improve Posterior Probability based Confidence Measures," International Symposium on Chinese Spoken Language Processing (ISCSLP2006), Lecture Notes in Artificial Intelligence, 4274, December 2006. ::: 241. Shih-Sian Cheng, Yeong-Yuh Xu, Hsin-min Wang and Hsin-Chia Fu, "Automatic Construction of Regression Class Tree for MLLR via Model-based Hierarchical Clustering," International Symposium on Chinese Spoken Language Processing (ISCSLP2006), Lecture Notes in Artificial Intelligence, 4274, December 2006. ::: 242. Hung-Ming Yu, Wei-Ho Tsai, and Hsin-min Wang, "A Music Retrieval System based on Query-by-singing for Karaoke Jukebox," Asian Information Retrieval Symposium (AIRS2006), Lecture Notes in Computer Science, 4182, October 2006. ::: 243. Yi-Hsiang Chao, Wei-Ho Tsai, Hsin-min Wang and Ruei-Chuan Chang, "Improving the Characterization of the Alternative Hypothesis via Kernel Discriminant Analysis for Likelihood Ratio-based Speaker Verification," Interspeech2006, September 2006. ::: 244. Jen-Wei Kuo and Hsin-min Wang, "Minimum Boundary Error Training for Automatic Phonetic Segmentation," Interspeech2006, September 2006. ::: 245. Yi-Hsiang Chao, Wei-Ho Tsai, Hsin-min Wang, and Ruei-Chuan Chang, "A Kernel-based Discrimination Framework for Solving Hypothesis Testing Problems with Application to Speaker Verification," International Conference on Pattern Recognition (ICPR2006), August 2006. ::: 246. Shih-Sian Cheng, Yi-Hsiang Chao, Hsin-min Wang, and Hsin-Chia Fu, "A Prototypes-Embedded Genetic K-means Algorithm," International Conference on Pattern Recognition (ICPR2006), August 2006. ::: 247. Wei-Ho Tsai and Hsin-min Wang, "On maximizing the within-cluster homogeneity of speaker voice characteristics for speech utterance clustering," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2006), May 2006. ::: 248. Hung-Ming Yu, Wei-Ho Tsai, and Hsin-min Wang, "A Query-by-singing Technique for Retrieving Polyphonic Objects of Popular Music," Asian Information Retrieval Symposium (AIRS2005), Lecture Notes in Computer Science, 3689, October 2005. ::: 249. Wei-Ho Tsai and Hsin-min Wang, "Speaker Clustering of Unknown Utterances Based on Maximum Purity Estimation," Interspeech2005, September 2005. ::: 250. Wei-Ho Tsai, Hung-Ming Yu, and Hsin-min Wang, "A Query-by-example Technique for Retrieving Cover Versions of Popular Songs with Similar Melodies," The sixth International Conference on Music Information Retrieval (ISMIR2005), September 2005. ::: 251. Hsien-Ting Cheng, Yi-Hsiang Chao, Shih-Liang Yeh, Chu-Song Chen, Hsin-Min Wang, and Yi-Ping Hung, "An Efficient Approach to Multi-modal Person Identity Verification by Fusing Face and Voice Information," IEEE International Conference on Multimedia & Expo (ICME2005), Amsterdam, The Netherlands,, July 2005. ::: 252. Wei-Ho Tsai and Hsin-min Wang, "On the extraction of vocal-related information to facilitate the management of popular music collections," IEEE/ACM Joint Conference on Digital Libraries (JCDL2005), June 2005. ::: 253. Yi-Hsiang Chao, Hsin-min Wang, and Ruei-chuan Chang, "GMM-Based Bhattacharyya Kernel Fisher Discriminant Analysis For Speaker Recognition," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2005), March 2005. ::: 254. Wei-Ho Tsai, Shih-Sian Cheng, Yi-Hsiang Chao, and Hsin-min Wang, "Clustering speech utterances by speaker using eigenvoice-motivated vector space model," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2005), March 2005. ::: 255. Chuang-Hua Chueh, Jen-Tzung Chien, and Hsin-min Wang, "A Maximum Entropy Approach for Integrating Semantic Information in Statistical Language Models," International Symposium on Chinese Spoken Language Processing (ISCSLP2004), Hong Kong, December 2004. ::: 256. Chih-Hsien Huang, Jen-Tzung Chien, and Hsin-min Wang, "A New Eigenvoice Approach to Speaker Adaptation," International Symposium on Chinese Spoken Language Processing (ISCSLP2004), Hong Kong, December 2004. ::: 257. ShaoHuang Pin, Yehlin Lee, Yong-cheng Chen, Hsin-min Wang, and Chiu-yu Tseng, "A Mandarin TTS System with an Integrated Prosodic Model," International Symposium on Chinese Spoken Language Processing (ISCSLP2004), Hong Kong, December 2004. ::: 258. Berlin Chen, Jen-Wei Kuo, Yao-Min Huang, and Hsin-min Wang, "Statistical Chinese Spoken Document Retrieval Using Latent Topical Information," Interspeech2004, Jeju Island, Korea, October 2004. ::: 259. Shih-Sian Cheng and Hsin-min Wang, "METRIC-SEQDAC: A Hybrid Approach for Audio Segmentation," Interspeech2004, Jeju Island, Korea, October 2004. ::: 260. Wei-Ho Tsai, Shih-Sian Cheng and Hsin-min Wang, "Speaker Clustering of Speech Utterances Using A Voice Characteristic Reference Space," Interspeech2004, Jeju Island, Korea, October 2004. ::: 261. Wei-Ho Tsai and Hsin-min Wang, "Towards Automatic Identification of Singing Language in Popular Music Recordings," International Conference on Music Information Retrieval (ISMIR2004), Barcelona, Spain, October 2004. ::: 262. Yin-cheng Chen, Tan-Hsu Tan, Hsin-min Wang, and Wei-Ho Tsai, "Performance Evaluation and Analysis of Mandarin Speech Recognition over Bluetooth Communication Environments," ROCLING XVI: Conference on Computational Linguistics and Speech Processing, Taipei, Taiwan, September 2004. 263. Wei-Ho Tsai and Hsin-min Wang, "A Query-by-Example Framework to Retrieve Music Documents by Singer," IEEE International Conference on Multimedia and Expo (ICME2004), Taipei, Taiwan, June 2004. ::: 264. Wei-Ho Tsai and Hsin-min Wang, "Automatic Detection and Tracking of Target Singer in Multi-Singer Music Recordings," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2004), Montreal, Quebec, Canada, May 2004. ::: 265. Wei-Ho Tsai and Hsin-min Wang, "Towards a Music Digital Library: A Content-based Processing Paradigm of Music Collections Using Solo Vocal Signal Modeling," International Conference on Digital Archive Technologies (ICDAT2004), Taipei, Taiwan, March 2004. ::: 266. Wei-Ho Tsai, Hsin-min Wang, Dwight Rodgers, Shi-sian Cheng, and Hung-Min Yu, "Blind Clustering of Popular Music Recordings Based on Singer Voice Characteristics," The fourth International Conference on Music Information Retrieval (ISMIR 2003), Baltimore, USA, October 2003. ::: 267. Shi-sian Cheng and Hsin-min Wang, "A Sequential Metric-based Audio Segmentation Method via The Bayesian Information Criterion," Interspeech2003, Geneva, Switzerland, September 2003. ::: 268. Wai-kit Lo, Yuk-chi Li, Gina Levow, Hsin-min Wang, and Helen Meng, "Multi-scale Document Expansion in English-Mandarin Cross-Language Spoken Document Retrieval," Interspeech2003, Geneva, Switzerland, September 2003. ::: 269. Wei-Ho Tsai, Hsin-min Wang, and Dwight Rodgers, "Automatic Singer Identification of Popular Music Recordings via Estimation and Modeling of Solo Vocal Signal," Interspeech2003, Geneva, Switzerland, September 2003. ::: 270. Hsin-min Wang, "MATBN 2002: A Mandarin Chinese Broadcast News Corpus," ISCA & IEEE Workshop on Spontaneous Speech Processing and Recognition (SSPR2003), Tokyo, April 2003. ::: 271. Kuan-Ting Chen, Shui-Lung Chuang, Frank Seide, Hsin-Min Wang, Lee-Feng Chien, and Eric Chang, "New Word Learning for Spoken Document Processing Through Discovery of Comparable Texts from External Resources," ISCA Workshop on Multilingual Spoken Document Retrieval (MSDR2003), Hong Kong, 2003. ::: 272. Mei-fang Huang, Kuan-ting Chen and Hsin-min Wang, "Towards Retrieval of Video Archives based on The Speech Content," International Symposium on Chinese Spoken Language Processing (ISCSLP2002), Taipei, August 2002. 273. Hsin-min Wang and Berlin Chen, "Comparison of Word and Subword Indexing Techniques for Mandarin Chinese Spoken Document Retrieval," The 2nd IEEE Pacific-Rim Conference on Multimedia (PCM'2001), Lecture Notes in Computer Science, 2195, pages 606-613, Beijing, October 2001. 274. Berlin Chen, Hsin-min Wang, and Lin-shan Lee, "An HMM/N-gram-based Linguistic Approach for Mandarin Spoken Document Retrieval," Interspeech2001, Aalborg Demark, September 2001. 275. Berlin Chen, Hsin-min Wang, and Lin-shan Lee, "Improved Spoken Document Retrieval by Exploring Extra Acoustic and Linguistic Cues," Interspeech2001, Aalborg Demark, September 2001. 276. Jeih-weih Hung, Hsin-min Wang, and Lin-shan Lee, "Comparative Analysis for Data-Driven Temporal Filters Obtained via Principal Component Analysis," Interspeech2001, Aalborg Demark, September 2001. 277. Kuan-ting Chen and Hsin-min Wang, "Eigenspace-based Linear Transformation Approach for Rapid Speaker Adaptation," ISCA Workshop on Adaptation Methods for Speech Recognition, Sophia Antipolis France, August 2001. 278. Hsin-min Wang, Berlin Chen, Liang-jui Shen, and Chao-chi Chang, "A Voice-Activated Web-based Mandarin Chinese Spoken Document Retrieval System," The 19th International Conference on Computer Processing of Oriental Languages (ICCPOL2001), pages 403-408, Seoul Korea, May 2001. 279. Hsin-min Wang, Helen Meng, Patrick Schone, Berlin Chen and Wai-kit Lo, "Multi-Scale Audio Indexing for Translingual Spoken Document Retrieval," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2001), Salt Lake City, USA, May 2001. 280. Kuan-ting Chen and Hsin-min Wang, "Eigenspace-based Maximum A Posteriori Linear Regression for Rapid Speaker Adaptation," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2001), Salt Lake City, USA, May 2001. 281. Helen Meng, Berlin Chen,....., Hsin-min Wang, and Jianqiang Wang, "Mandarin English Information (MEI) : Investigating Translingual Speech Retrieval," Human Language Technology Conference (HLT2001), San Diego, March 2001. 282. Berlin Chen, Hsin-min Wang, and Lin-shan Lee, "Retrieval of Mandarin Broadcast News using Spoken Queries," Interspeech2000, Beijing, October 2000. 283. Wen-ping Hsieh, Berlin Chen, Kuan-ting Chen, and Hsin-min Wang, "Initial Experiments on Recognition of Internet-Accessible Compressed Mandarin Speech," International Symposium on Chinese Spoken Language Processing (ISCSLP2000), Beijing, October 2000. 284. Jeih-weih Hung, Hsin-min Wang, and Lin-shan Lee, "Automatic Metric-based Speech Segmentation for Broadcast News via Principle Component Analysis," Interspeech2000, Beijing,, October 2000. 285. Kuan-ting Chen, Wen-wei Liau, Hsin-min Wang, and Lin-shan Lee, "Fast Speaker Adaptation using Eigenspace-based Maximum Likelihood Linear Regression," Interspeech2000, Beijing, October 2000. 286. Berlin Chen, Hsin-min Wang, and Lin-shan Lee, "Retrieval of Broadcast News Speech in Mandarin Chinese Collected in Taiwan Using Syllable-level Statistical Characteristics," IEEE Int. Conf. Acoustics, Speech, Signal processing (ICASSP2000), Istanbul, Turkey, June 2000. 287. Helen Meng, Sanjeev Khudanpur, Gina Levow, Douglas W. Oard, and Hsin-min Wang, "Mandarin English Information (MEI) - Investigating Translingual Speech Retrieval," NAACL Workshop on Embedded Machine Translation, Seattle, Washington, USA, May 2000. 288. Helen Meng, Sanjeev Khudanpur, Douglas W. Oard, and Hsin-min Wang, "Mandarin English Information (MEI)," Topic Detection and Tracking Workshop (TDT-3), Vienna, Virginia, USA, February 2000. 289. Bor-shen Lin, Hsin-min Wang, and Lin-shan Lee, "A Distributed Architecture for Cooperative Spoken Dialogue Agents with Coherent Dialogue State and History," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU'99), Keystone, Colorado, USA, December 1999. 290. Lee-feng Chien and Hsin-min Wang, "Exploration of Spoken Access for Chinese Text and Speech Information Retrieval," Internationl Symposium on Signal Processing and Intelligent System (ISSPIS'99), pages 578-583, Guangzhou, China, November 1999. 291. Bor-shen Lin, Hsin-min Wang, and Lin-shan Lee, "Consistent Dialogue across Concurrent Topics based on An Expert System Model," European Conf on Speech Communication and Technology, pages 1427-1430, Budapest Hungary, September 1999. 292. Bor-shen Lin and Hsin-min Wang, "Handling Multiple Topics in Spoken Dialogue Systems using Inference Trees," The 18th International Conference on Computer Processing of Oriental Languages (ICCPOL'99), pages 293-296, Tokushima Japan, March 1999. 293. Bo-ren Bai, Berlin Chen, Hsin-min Wang, Lee-feng Chien, and Lin-shan Lee, "Large-Vocabulary Chinese Text/Speech Information Retrieval Using Mandarin Speech Queries," International Symposium on Chinese Spoken Language Processing (ISCSLP98), pages 284-289, Singapore, December 1998. 294. Berlin Chen, Hsin-min Wang, Lee-feng Chien, and Lin-shan Lee, "A*-admissible key-phrase spotting with sub-syllable level utterance verification," International Conference on Spoken Language Processing (ICSLP98), Sydney, Australia, December 1998. 295. Hsin-min Wang, Bor-shen Lin, Bo-ren Bai, and Berlin Chen, "Towards a Mandarin voice memo system," International Conference on Spoken Language Processing (ICSLP98), Sydney, Australia, December 1998. 296. Berlin Chen and Hsin-min Wang, "A vocabulary-flexible key-phrase spotting system for Mandarin Chinese," The Fourth International Symposium on Real-time and Media Systems (RAMS98), pages 176-180, Taipei, September 1998. 297. Hsin-min Wang, Yu-hsueh Chou, and Berlin Chen, "Surfing the Chinese Web pages by unconstrained Mandarin speech," IEEE International Conference on Consumer Electronics (ICCE98), pages 84-85, Los Angeles, June 1998. 298. Bor-shen Lin, Hsin-min Wang, Bo-ren Bai, and Berlin Chen, "A prototype of Mandarin voice memo system," IEEE International Conference on Consumer Electronics (ICCE98), pages 88-89, Los Angeles, June 1998. 299. Hsin-min Wang and Berlin Chen, "A key-phrase understanding framework integrating real world knowledge with speech recognition with initial application in voice memo systems for Chinese language," IEEE Region 10 Annual Conference (TENCON97), pages 157-160, December 1997, Brisbane, Australia 300. Bo-ren Bai, Hsin-min Wang, and Lin-shan Lee, "A word-length-dependent confidence measure for large vocabulary Chinese keyword spotting," IEEE Region 10 Annual Conference (TENCON97), 595-598, December 1997. 301. Lee-feng Chien, Sung-chien Lin, Jenn-chau Hong, Ming-chiuan Chen, Hsin-min Wang, Jia-lin Shen, Keh-jiann Chen, and Lin-shan Lee, "Internet Chinese information retrieval using unconstrained Mandarin speech queries based on a client-server architecture and a PAT-tree-based language models," IEEE Int. Conf. Acoustics, Speech, and Signal Processing (ICASSP'97), volume 2, pages 1155-1158, Munich, Germany, May 1997. 302. Bo-ren Bai, Hsin-min Wang, and Lin-shan Lee, "Log-likelihood score normalization techniques for recognition of Chinese keywords with large vocabulary," Int. Conf. Computer Processing of Oriental Languages (ICCPOL'97), pages 186-191, Hong-kong, April 1997. 303. Hsin-min Wang, Bor-shen Lin and Bo-ren Bai, "Voice retrieval of Mandarin speech database," Int. Workshop on Information Retrieval with Asian Languages, pages 185-190, Tsukuba-City, Japan, 1997. 304. Tai-hsuan Ho, Hsin-min Wang, Lee-feng Chien, and Lin-shan Lee, "Fast and accurate continuous speech recognition for Chinese language with very large vocabulary," European Conf on Speech Communication and Technology, volume 1, pages 211-214, Madrid, Spain, September 1995. 305. Hsin-min Wang, Jia-lin Shen, Yen-ju Yang, Chiu-yu Tseng, and Lin-shan Lee, "Complete recognition of continuous Mandarin speech for Chinese language with very large vocabulary but limited training data," IEEE Int. Conf. Acoustics, Speech, Signal Processing, pages 61-64, Detroit, Michigan U.S.A, 1995. 306. Hsin-min Wang and Lin-shan Lee, "A fast approximate algorithm for parametric variable duration HMM's for speech recognition," Int. Conf. Computer Processing of Oriental Languages, pages 4-7, Hawaii, 1995. 307. Renyuan Lyu, Hsin-min Wang, Shiao-Hong Hwang, Chiu-yu Tseng, and Lin-shan Lee, "A comparison of different acoustic units applied to isolated/continuous large-vocabulary Mandarin speech recognition," Int. Conf. Computer Processing of Oriental Languages, pages 211-214, Taejon, Korea, 1994. 308. Hsin-min Wang, Renyuan Lyu, Jia-lin Shen, and Lin-shan Lee, "An initial study on large-vocabulary continuous Mandarin speech recognition with limited training data based on sub-syllabic models," Int. Computer Symposium, pages 1140-1145, Hsin-chu, R.O.C, 1994. 309. Jia-lin Shen, Hsin-min Wang, Renyuan Lyu, and Lin-shan Lee, "Incremental speaker adaptation using phonetically balanced sentences for Mandarin syllable recognition based on segmental probability models," Int. Conf. Spoken Language Processing, pages 443-446, Yokohama, Japan, 1994. 310. Jia-lin Shen, Hsin-min Wang, Bo-ren Bai, and Lin-shan Lee, "An initial study on a segmental probability model approach to large-vocabulary continuous Mandarin speech recognition," IEEE Int. Conf. Acoustics, Speech, Signal Processing, volume 11, pages 133-136, Adelaide, South Australia, 1994. 311. Hsin-min Wang, Yuan-cheng Chang, and Lin-shan Lee, "An algorithm for automatically selecting phonetically balanced sentences from a large corpus for training and testing a speech recognition system," Int. Conf. Computer Processing of Oriental Languages, pages 207-210, Taejon, Korea, 1994. Technical Reports 1. Helen Meng, Berlin Chen, Erika Grams, Sanjeev Khudanpur, Wai-Kit Lo, Gina-Anne Levow, Douglas Oard, Patrick Schone, Karen Tang, Hsin-Min Wang, and Jian Qiang Wang, "Mandarin-English Information (MEI): Investigating Translingual Speech Retrieval," Technical Report for The Johns Hopkins University Summer Workshop 2000, 2000. Book & Book Chapters 1. Ju-Chiang Wang, Yi-Hsuan Yang, and Hsin-Min Wang,, chapter "Affective music information retrieval," "Emotions and Personality in Personalized Services," M. Tkalčič, B. De Carolis, M. de Gemmis, A. Odić and and A. Košir, editors, pages 227-261, Springer International Publishing, 2016, a preliminary version of the chapter is available at http://arxiv.org/abs/1502.05131 2. Hsin-Min Wang, Jen-Wei Kuo, and Hung-Yi Lo,, chapter "Improved HMM-SVM-based automatic phoneme segmentation," Computer Processing of Asian Spoken Languages, Shuichi Itahashi and Chiu-yu Tseng, editor, pages 275-278, Consideration Books, c/o The Americas Group, Los Angeles, CA, USA, 2010. 3. Sin-Horng Chen, Chiu-yu Tseng, and Hsin-min Wang,, chapter "Tone Modeling for Speech Synthesis," Advances in Chinese Spoken Language Processing, Chin-Hui Lee, Haizhou Li, Lin-shan Lee, Ren-Hua Wang and and Qiang Huo, editors, pages 77-98, World Scientific, 2006. 4. Berlin Chen, Hsin-min Wang, and Lin-shan Lee,, chapter "Spoken Document Retrieval and Summarization," Advances in Chinese Spoken Language Processing, Chin-Hui Lee, Haizhou Li, Lin-shan Lee, Ren-Hua Wang and and Qiang Huo, editors, pages 301-320, World Scientific, 2006. Others 1. Ju-Chiang Wang, Yi-Hsuan Yang, and Hsin-Min Wang, "Affective Analysis of Music Signals using Acoustic Emotion Gaussians: A Brief Overview," April 2015, APSIPA Newsletter ::: 2. Hsin-Min Wang, "Continuous Mandarin Speech Recognition with Very Large Vocabulary : The Golden Mandarin (III) Dictation System (Workstation Version)," Ph.D. thesis, National Taiwan University, July 1995.