指示チューニングされた大規模言語モデルが医療翻訳でベースラインの性能を上回る

世界翻訳ニュース

大規模言語モデル(LLM)は、利用可能なリソースが少ない言語ペアや分野では訓練データが特定の用語や文脈のニュアンスに適切に対応できないため、翻訳の精度に限界がある。この問題を改善するため、指示チューニングによって医療の専門用語をLLMに組み込む手法が提案された。LLMに与えられる指示の一部に専門用語が含まれることで、各セグメントを翻訳する際に適切な用語が提示されるようになる。また、原文の用語と対応する訳語のペアを特定することで、正確な用語の適用が可能になるとともに、適切に一致した用語がLLMに与えられる指示テンプレートに組み込まれる。