發個叉,分享使用機器翻譯的經驗(或竅門)。最近跟@HallidayTerry 教授合作一個研究,需將大量中文,機器翻譯成英文。如何得到比較理想的譯文?1) 翻譯前對中文進行初步清理,去掉語氣詞、重複、和無用的插入語,矯正句法,主謂賓結構完整而端正。中文句法不規整,機器會翻譯得亂七八糟。2) 預先提供中文特有的縮略語、特有名詞的譯法。如對文本做了這兩步預先處理,餵給機器後,會得到相當好的譯文,完全可滿足研究者看資料的初步需要。
機器翻譯的能力本身也在快速改善中,在詞與詞組這個水平上,已相當不錯,出錯的時候多是原文句法有毛病。我用的是 https://t.co/YOlJT4raZe