機械翻訳を向上するための品質指標の使用方法とは?

世界翻訳ニュース

人間のフィードバックによる強化学習(RLHF)は、大規模言語モデル(LLM)や機械翻訳(MT)の能力を向上させる重要なツールである。新たな研究では、MTプロセスの様々な段階に人間によるフィードバックを組み込むことで、LLMによって生成されたテキストの品質が大幅に改善される可能性があることが明らかになった。様々な技術を用い、品質指標を報酬モデルとしてMTパイプラインに統合したところ、自動品質推定と、人間による品質アノテーションから学習した評価指標との開発で大きな進歩が見られた。

この品質指標を統合して利用する技術によって、MTシステムはより人間の判断に沿った翻訳文を優先するようになり、結果的に深刻な誤訳の頻度の低減につながることが期待される。