한국어-외국어 병렬 말뭉치 구축을 위한 번역 지침 Translation Guidelines for Building Korean-Foreign Language Parallel Corpora


ISBN 9791167480903

Language Korean

N. of Pages 348쪽

Size/Weight 159 * 231 * 33 mm / 896 g

Author/Editor 한국어-외국어 병렬 말뭉치 구축 사업단 엮음

Publisher 하우

Date of Publication 2023년 03월 02일

Country of Origin Korea


이 책은 문화체육관광부 국립국어원의 주관 아래 시행된 ‘2021년 한국어-외국어 병렬 말뭉치 구축 사업’ 및 ‘2022년 한국어-외국어 병렬 말뭉치 구축 사업’의 성공적 수행을 위해 관련 전문가들이 머리를 맞대고 고민한 결과를 묶은 것입니다. (사)국제한국어교육학회와 (주)플리토가 컨소시엄으로 구성된 ‘한국어-외국어 병렬 말뭉치 구축 사업단’에서는 자동 번역 등 언어 문화 산업을 활성화하고자 한국어를 8개 언어로 번역한 병렬 말뭉치를 구축하고 있습니다. 8개 언어는 베트남어, 인도네시아어, 태국어, 인도 힌디어, 캄보디아어, 필리핀 타갈로그어, 러시아어, 우즈베크어입니다. 사업단에서는 1차와 2차 사업을 통해 총 2천만 어절 규모의 병렬 말뭉치를 구축하였습니다.

이러한 병렬 말뭉치를 구축하는 과정에서 한국어를 8개 언어로 정확하고 일관되게 번역하기 위해 본 번역 지침을 마련하였습니다. 그리고 한국어 원문의 명료성을 제고하고 번역을 용이하게 하기 위해 원문 정제 지침도 마련하였습니다. 번역 지침은 문화체육관광부 훈령 제448호 ‘공공 용어의 외국어 번역 및 표기 지침’을 바탕으로 8개 언어의 특징과 각 언어의 관련 규범 및 번역 관례를 참고하였고, 한국어 원문 정제 지침은 한글 맞춤법 등의 한국어 어문 규정과 표준국어대사전 및 국립국어원의 여러 자료를 참고하였습니다. 다만 이 8개 언어 번역 지침과 한국어 원문 정제 지침은 본 사업에 특화된 지침으로서 인공지능 학습용 데이터 구축에 적용되는 내용이라고 할 수 있습니다.

이 책의 내용은 크게 두 가지로 나뉩니다. 하나는 한국어 원문을 정제하기 위한 지침이고, 다른 하나는 한국어를 8개 언어로 번역하는 데 적용하는 번역 지침들입니다. 이 지침들은 사업단에 참여한 많은 연구진이 공동으로 이뤄 낸 결과물입니다.


This book is the result of the brainstorming efforts of relevant experts for the successful implementation of the ‘2021 Korean-Foreign Language Parallel Corpus Construction Project’ and the ‘2022 Korean-Foreign Language Parallel Corpus Construction Project’ implemented under the auspices of the National Institute of the Korean Language under the Ministry of Culture, Sports and Tourism. It is a bundle of . The 'Korean-Foreign Language Parallel Corpus Construction Project Group', which is a consortium of the International Korean Language Education Society and Flitto Co., Ltd., is building a parallel corpus that translates Korean into eight languages ​​in order to revitalize the language and culture industry such as automatic translation. . The eight languages ​​are Vietnamese, Indonesian, Thai, Indian Hindi, Cambodian, Filipino Tagalog, Russian, and Uzbek. The project group built a parallel corpus totaling 20 million words through the first and second projects.

In the process of building this parallel corpus, we established these translation guidelines to accurately and consistently translate Korean into eight languages. We also established guidelines for refining the original text to improve the clarity of the Korean text and facilitate translation. The translation guidelines refer to the characteristics of eight languages ​​and the related norms and translation practices of each language based on the Ministry of Culture, Sports and Tourism's Directive No. 448, 'Guidelines for foreign language translation and notation of public terms', and the Korean original text refining guidelines refer to Korean spelling, etc. I referred to Korean language regulations, the Standard Korean Dictionary, and various materials from the National Institute of the Korean Language. However, these eight language translation guidelines and Korean original text refining guidelines are guidelines specific to this project and can be said to be applied to building data for artificial intelligence learning.

The contents of this book are largely divided into two parts. One is a guideline for refining the original Korean text, and the other is a set of translation guidelines applied to translating Korean into eight languages. These guidelines are the result of the joint efforts of many researchers participating in the project group.

