Dịch tự động Dịch tự động Bởi: Wiki Pedia Dịch tự động hay còn gọi là dịch máy (tiếng Anh: machine translation) là một nhánh của xử lý ngôn ngữ tự nhi

Tài liệu tương tự
Tom tat luan van - Nhung cuoi.doc

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM NGHỆ THUẬT TRUNG ƯƠNG ĐẶNG THỊ THU TRANG RÈN LUYỆN KỸ NĂNG HÁT CHO SINH VIÊN NGÀNH GIÁO DỤC TIỂU HỌC TRƯ

Đoàn Viết Hoạt và sứ mệnh xương rồng Đỗ Thái Nhiên So với các loài thực vật khác, xương rồng là loại cây có sức chịu đựng cao cấp nhất và trường kỳ nh

UBND QUẬN HÀ ĐÔNG PHÒNG GIÁO DỤC VÀ ĐÀO TẠO Số: 851/HD-PGD&ĐT CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc Hà Đông, ngày 07 tháng 9

BCTC Mẹ Q xlsx

2018 Nhận xét, phân tích, góp ý cho Chương trình môn Tin học trong Chương trình Giáo dục Phổ thông mới

Lời giới thiệu Chia sẽ ebook : Tham gia cộng đồng chia sẽ sách : Fanpage : C

CHƯƠNG 2

ch­ng1

Chinh phục tình yêu Judi Vitale Chia sẽ ebook : Tham gia cộng đồng chia sẽ sách : Fanpage :

BỘ QUY TẮC ỨNG XỬ Chúng ta hoạt động trong một nền văn hóa với các tiêu chuẩn đạo đức cao nhất

năm TRƯỜNG TRUNG HỌC PHỔ THÔNG LONG TRƯỜNG

CHƯƠNG 10

Truyện ngắn Bảo Ninh

Microsoft Word - 11_Phep_Hoi_Xuan doc

NH?NG M?NH TR?I KHÁC BI?T

Nghị luân xã hội về vấn nạn Game online trong học đường

ẤN QUANG PHÁP SƯ VĂN SAO TỤC BIÊN ẤN QUANG PHÁP SƯ VĂN SAO TỤC BIÊN Giảng giải: Đại Sư Ấn Quang Việt dịch: Bửu Quang Tự đệ tử Như Hòa PHẦN MƯỜI HAI 19

Document

CÁC TỪ VIẾT TẮT, KÝ HIỆU ĐƯỢC DÙNG TRONG LUẬN VĂN

7. CÁC CHỦ ĐỀ VÀ BÀI HỌC TỪ ĐỔI MỚI CÔNG TÁC QUẢN TRỊ NHÀ NƯỚC Những tiến bộ to lớn của Việt Nam trong việc duy trì tốc độ tăng trưởng kinh tế cao, gi

Nhà quản lý tức thì

Microsoft Word - NghiDinh CP ve SoHuuTriTue.doc

Thỏa thuận Quan hệ Khách hàng cho Sản phẩm

Microsoft Word - Day_lop_4_P1.doc

LỜI GIỚI THIỆU Chia sẽ ebook : Tham gia cộng đồng chia sẽ sách : Fanpage : C

Tiên Tri Về Thời Cuộc của Việt Nam và Thế Giới Phạm Công Tắc

CÔNG TÁC HOẰNG PHÁP THỜI CÁCH MẠNG CÔNG NGHIỆP CÔNG TÁC HOẰNG PHÁP THỜI CÁCH MẠNG CÔNG NGHIỆP 4.0 HT. Thích Tâ n Đa t* TÓM TẮT: Cuộc cách mạng

Microsoft Word - SGV-Q4.doc

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN THỊ ĐÔ YẾU TỐ TỰ TRUYỆN TRONG TRUYỆN NGẮN THẠCH LAM VÀ THANH TỊNH Chuyên ngành: Văn học Việt Nam Mã số:

Microsoft Word - [vanbanphapluat.co] qcvn bgtvt

Nghị luận về sách

Table of Contents Marketing du kích: Lời nói đầu NGÀY THỨ NHẤT: Tư duy marketing du kích NGÀY THỨ HAI: Mục đích marketing NGÀY THỨ BA: Cạnh tranh và n

Những Thành Tựu Lẫy Lừng Trong Tâm Lý Học Hiện Đại Pierre Daco Chia sẽ ebook : Tham gia cộng đồng chia sẽ sách : Fanpa

KINH PHÁP CÚ Illustrated Dhammapada Illustrations by Mr. P. Wickramanayaka Tâm Minh Ngô Tằng Giao CHUYỂN DỊCH THƠ

Brochure Privater - Tieng viet view Sercure

Đề 11 – Giới thiệu về một loài cây hoặc loài hoa.(cây mai) – Phát triển kỹ năng làm bài văn chọn lọc 9

PHƯƠNG TIỆN DẠY HỌC

Giới thiệu chiếc bánh chưng ngày Tết – Văn mẫu lớp 9

Việc thiết kế và trình bày các nội dung trong ấn phẩm này không thể hiện bất kỳ quan điểm nào của UNESCO về tình trạng pháp lý của bất kỳ quốc gia, lã

BÁT ĐOẠN CẨM

Baûn Tin Theá Ñaïo Soá 128 ngaøy Núi Bà Tây Ninh 1*- Thiệp Mời Tiệc Tân Niên Kỷ Hợi 2019 của Tậy Ninh Đồng Hương Hội - Hoa Kỳ tổ chức ngày 1

Đề cương chương trình đại học

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM NGHỆ THUẬT TRUNG ƯƠNG NGUYỄN DOÃN ĐÀI QUẢN LÝ DI TÍCH LỊCH SỬ VĂN HÓA ĐÌNH HUỀ TRÌ, XÃ AN PHỤ, HUYỆN KIN

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG LÊ THỊ PHƢƠNG THANH THÀNH NGỮ, TỤC NGỮ TRONG TRUYỆN NGẮN MA VĂN KHÁNG Chuyên ngành: Ngôn ngữ học Mã số:

Thuyết minh về hoa hồng – Văn mẫu lớp 8

Thuyết minh về cây hoa đào – Văn mẫu lớp 8

Tình Thương Nhân Loại, bài Đức Diêu Trì Kim Mẫu

Microsoft Word - hong vu cam thu.doc

JURGEN WOLFF TẬP TRUNG - SỨC MẠNH CỦA TƯ DUY CÓ MỤC TIÊU FOCUS: THE POWER OF TARGETED THINKING, Bản quyền tiếng Việt 2009 Công ty Sách Alpha Phan Thu

LỜI TỰA Sau khi cuốn sách Kinh nghiệm thành công của ông chủ nhỏ đầu tiên của tôi được phát hành, không ngờ chỉ trong vòng nửa năm đã có tới hơn một t

TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH KHOA HÓA HỌC KHÓA LUẬN TỐT NGHIỆP Tên đề tài: SỬ DỤNG MOODLE THIẾT KẾ WEBSITE HỖ TRỢ VIỆC TỰ HỌC CHƯƠNG HIDROCA

ĐỀ CƯƠNG BÁO CÁO CHÍNH TRỊ TRÌNH ĐẠI HỘI ĐẢNG BỘ TỈNH LẦN THỨ XV

BỘ GIÁO DỤC VÀ ĐÀO TẠO VỤ GIÁO DỤC TRUNG HỌC CHƢƠNG TRÌNH PHÁT TRIỂN GIÁO DỤC TRUNG HỌC Giai đoạn 2 TÀI LIỆU TẬP HUẤN CÁN BỘ QUẢN LÍ, GIÁO VIÊN TRUNG

Phân tích bài thơ Bánh trôi nước của Hồ Xuân Hương

Sấm Truyền Đức Phật Thầy Tây An Biến dời cuộc thế thình lình,* Thiện tồn ác thất Thiên đình số phân. Vần xây thế giái {giới} phàm trần, Sự mình không

1

Microsoft Word - TRAO Ð?I V?I N? CA SI B?O Y?N - Ban Biên T?p T?p Chí Quy Nguyên.doc

Microsoft Word - BussinessPlanBook-Vietnam-skabelon-nybund.doc

Lão Pháp Sư TỊNH KHÔNG đề xướng Pháp Sư THÍCH TỰ LIỄU kính biên NHẬT MỘ ĐỒ VIỄN TRỜI ĐÃ XẾ BÓNG, ĐƯỜNG VỀ CÒN XA Lớp học tập Tịnh Độ Vô Lượng Thọ Khoa

Đề cương chương trình đại học

ĐÊ CƯƠNG CHI TIẾT HỌC PHẦN

BỘ GIÁO DỤC VÀ ĐÀO TẠO

SỞ GDĐT TỈNH BÌNH DƯƠNG XÂY DỰNG VĂN HÓA PHÁP LÝ, ỨNG XỬ VĂN MINH Số 08 - Thứ Hai,

Đời Lưu Tống, ngài Cầu Na Bạt Ma dịch Phạn Hán Đời Minh, ngài Trí Húc chú thích Thích Pháp Chánh dịch Hán Việt Kinh Năm Giới Tướng của Ưu Bà Tắc Chú t

NHÖÕNG LÔØI CHÆ DAÏY TAÂM HUYEÁT

"NHÂN-QUẢ" & ĐẠO ĐỨC

Kinh Dai Thong Phuong Quang Sam Hoi Diet Toi Trang Nghiem Thanh Phat - HT Trung Quan Dich

Microsoft Word - IP Law 2005 (Vietnamese).doc

Bồ Tát Phật giáng trần bằng hai thân, một là Chơn Thân {Kim Thân}, hai là Giả Thân {Xác Trần}. Để hoàn thành sứ mạng cứu thế, Bồ Tát phải giáng trần n

Chuyên đề

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM NGHỆ THUẬT TRUNG ƯƠNG PHẠM THỊ THU HƯƠNG DẠY HỌC MỸ THUẬT THEO HƯỚNG TIẾP CẬN PHÁT TRIỂN NĂNG LỰC Ở TRƯỜ

19/12/2014 Do Georges Nguyễn Cao Đức JJR 65 chuyễn lại GIÁO DỤC MIỀN NAM

daithuavoluongnghiakinh

Kỹ năng tạo ảnh hưởng đến người khác (Cẩm nang quản lý hiệu quả) Roy Johnson & John Eaton Chia sẽ ebook : Tham gia cộn

Baûn Tin Theá Ñaïo Soá 134 ngaøy TRONG SỐ NẦY 1- Thông báo số 10/VP/BTĐHN ngày về việc Ban Thế Đạo Hải Ngoại không có Tổ Chức Đại H

So tay luat su_Tap 3_ _file in.indd

CHƯƠNG 1

Document

Baûn Tin Theá Ñaïo Soá 135 ngaøy TRONG SỐ NẦY 1- Thông báo số 11/VP/BTĐHN ngày về việc thành phần Ban Quản Nhiệm Ban Thế Đạo Hải N

2.3. Đào tạo phương pháp điều tra và thực hành điền dã trong ngành nhân học xã hội: «Ảnh hưởng lợi-hại căng thẳng và xung đột quanh vấn đề sở hữu và s

MỞ ĐẦU

MỘT SỐ LƯU Ý KHI DẠY CÁC TIẾT ÔN TẬP CHƯƠNG Môn Tin học cung cấp cho học sinh những kiến thức phổ thông về ngành khoa học tin học, hình thành và phát

Máy tính cá nhân Máy tính cá nhân Bởi: Wiki Pedia Định nghĩa Máy tính cá nhân (tiếng Anh: personal computer, viết tắt PC) là một máy điện toán siêu nh

ĐỊNH DANH KỲ THƯ 定名奇书 Xem, kiểm tra và tư vấn tên cho bé mới chào đời, đổi tên cho người lớn *** CHỦ MỆNH Thân chủ giới tính Nam Sinh vào Thứ Sáu, ngà

Thuyết minh về chiếc áo dài Việt Nam – Văn mẫu lớp 8

QUY TRÌNH KỸ THUẬT AN TOÀN KHOAN ĐCCT (Ban hành theo QĐ số 292 /QĐ-QLKT ngày 05 tháng 07 năm 2016 của Công ty Cổ phần Tư vấn thiết kế kiểm định và Địa

Truyền thông có nhạy cảm giới Tài liệu dành cho các cán bộ làm công tác tuyên giáo Hội Liên hiệp Phụ nữ Việt Nam Nhóm biên soạn

Con đường dẫn đến chân hạnh phúc

Thuyết minh về Văn Miếu Quốc Tử Giám

Biến Cố : 40 Năm Nhìn Lại (Phần I) Bảo Vũ (ABC Radio) Hôm nay, cách đây đúng 40 năm, vào ngày mùng 2 tháng 11 năm 1963, cuộc đảo chính tại Sà

Thuyết minh về một thắng cảnh quê em – Văn Thuyết minh 9

Chương trình Giảng dạy Kinh tế Fulbright Kinh tế học khu vực công Cải cách thuế GTGT ở Việt Nam Niên khoá Nghiên cứu tình huống Chương trình

Đàm Loan và Đạo Xước

1. Tình hình thế giới và trong nước sau Cách mạng Tháng Tám năm 1945 Sau Chiến tranh thế giới lần thứ II, chủ nghĩa xã hội trở thành hệ thống trên thế

Trung Phong Tam Thời Hệ Niệm

Hotline: Chùa Bái Đính - Khu du lịch Tràng An - Lễ chùa cầu an 1 Ngày - 0 Đêm (T-D-OT-VNMVNB-40)

Microsoft Word - PhuongThuy-Mang_van_hoc_tren_bao_Song.doc

Bản ghi:

Bởi: Wiki Pedia hay còn gọi là dịch máy (tiếng Anh: machine translation) là một nhánh của xử lý ngôn ngữ tự nhiên thuộc phân ngành trí tuệ nhân tạo, nó là sự kết hợp giữa ngôn ngữ, dịch thuật và khoa học máy tính. Như tên gọi, dịch tự động thực hiện dịch một ngôn ngữ này (gọi là ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (gọi là ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Khó khăn của việc thiết kế chương trình dịch tự động là làm sao khử nhập nhằng hiệu quả. Nói về tính nhập nhằng, đây là khái niệm chỉ tính không rõ ràng của ngôn ngữ, chẳng hạn khi viết từ đường kính thì vẫn chưa rõ là nó chỉ một loại "chất ngọt dùng để pha làm đồ uống" hay là "đoạn thẳng đi qua tâm và nối hai điểm của đường tròn, của mặt cầu". Nhập nhằng như ví dụ vừa rồi là do hiện tượng đồng âm (hoặc đồng tự) gây ra, một số kiểu nhập nhằng khác như nhập nhằng từ loại, nhập nhằng từ đa nghĩa. Khi dịch tự động từ tiếng Việt sang tiếng Anh, khó khăn đầu tiên lại là việc xác định ranh giới từ, không giống như tiếng Anh (và nhiều ngôn ngữ khác) mỗi từ đã mang trọn vẹn một nghĩa và được xác định ranh giới qua khoảng trắng, tiếng Việt là ngôn ngữ đơn lập do vậy có rất nhiều từ ghép, nếu không xác định đúng sẽ xuất hiện kiểu dịch từng từ rồi ghép lại với nhau ví dụ như từ "miễn bàn" có thể bị dịch thành free table. Với tiếng Anh do là ngôn ngữ biến hình nên việc xác định từ loại dễ hơn, ngoài ra nó cũng ít từ đồng tự (hai từ có ký tự hoàn toàn giống nhau nhưng mang nghĩa khác nhau), còn về từ đa nghĩa tiếng Anh cũng như tiếng Việt và hầu như tất cả các ngôn ngữ khác đều rất phức tạp, muốn xác định nghĩa chính xác phải phải thực hiện phân tích văn cảnh. Sau khi xác định nghĩa phù hợp của từ, công việc tiếp theo là sắp xếp để tạo thành câu hoàn chỉnh. Nếu hai ngôn ngữ có cấu trúc càng khác nhau bao nhiêu công việc này càng phức tạp bấy nhiêu, với những ngôn ngữ gần nhau như tiếng Anh và tiếng Pháp công việc tương đối đơn giản, nhưng giữa tiếng Pháp và tiếng Trung thì rất khó khăn. Để sắp xếp người ta đưa vào các cấu trúc ngữ pháp hết sức phức tạp, áp dụng nhiều kiến thức toán học nhưng thực tế cho thấy hiệu quả của chúng vẫn không được tốt. Một cách tiếp cận khác trong lĩnh vực này là dựa vào tư liệu đã dịch sẵn của con người, điển hình là Google Translate, nó nạp hàng triệu trang tư liệu sau đó thực hiện các thao tác mà nó gọi là thống kê kiến thức để phân tích cho các lần dịch tự động sau này, kiểu dịch rất gần với thao tác tìm kiếm - lĩnh vực đặc biệt mạnh của Google. 1/5

Lịch sử của dịch tự động Quốc tế Lịch sử của dịch tự động bắt đầu từ thế kỷ 17, khi hai nhà triết học Leibniz và Descartes đưa ra những ý tưởng đầu tiên về các mã thực hiện mối liên hệ giữa nhiều ngôn ngữ, nhưng tất cả những đề xuất này chỉ dừng lại ở mức lý thuyết mà không có một ứng dụng thực tế nào. Sáng chế đầu tiên cho một "chương trình dịch tự động" được thực hiện vào khoảng giữa thập niên 1930. Vào thời điểm này Georges Artsruni đã tạo ra một bộ từ điển song ngữ với chức năng tra từ tự động bằng các băng giấy, tiếp theo một người Nga là Pyotr Troyanskii tiếp tục phát triển với nhiều chi tiết hơn. Nó không chỉ có một bộ từ điển song ngữ mà còn bao gồm các quy tắc ngữ pháp cơ bản dựa trên quốc tế ngữ (Esperanto). Lịch sử của dịch tự động được chính thức ghi nhận từ thập niên 1950 mặc dù như trên trình bày trước đó một số công việc ở dạng manh nha đã được thực hiện. Vào năm 1954, thực nghiệm Georgetown-IBM đã thực hiện thành công thí nghiệm dịch tự động hoàn toàn hơn 60 câu tiếng Nga sang tiếng Anh. Thành công bước đầu này đã tạo điều kiện để lập ra những quỹ đầu tư có giá trị cho các nghiên cứu. Các tác giả (tại thời điểm đó) tuyên bố rằng chỉ trong vòng từ 3 đến 5 năm nữa vấn đề dịch máy sẽ được giải quyết. Nhưng thực tế kết quả chậm hơn nhiều, báo cáo ALPAC vào năm 1966 cho thấy sau hơn 10 năm nghiên cứu lĩnh vực này vẫn không có những tiến bộ đáng kể và hệ quả là số tiền chi cho nghiên cứu giảm mạnh. Vào cuối thập niên 1980, khi máy vi tính có tốc độ xử lý cao hơn đồng thời lại rẻ hơn thì người ta mới bắt đầu quan tâm hơn đến mô hình thống kê vốn đòi hỏi khả năng xử lý dữ liệu cực lớn mà trước đó không thể thực hiện được vì các nguyên nhân kỹ thuật cũng như kinh tế. Lĩnh vực dịch tự động trong vài năm qua đã có những thay đổi lớn, có rất nhiều nghiên cứu dựa trên các nền tảng thống kê và ví dụ mẫu. Hiện nay có một số công ty xây dựng chương trình dựa trên thống kê như Language Weaver (chuyên cung cấp các sản phẩm và dịch vụ thương mại liên quan đến dịch thuật), Google và Microsoft cũng có các sản phẩm tương tự do chính họ giữ bản quyền. Một hướng tiếp cận mới là kết hợp (lai ghép) các phương pháp với nhau, như những nghiên cứu phối hợp giữa các nguyên tắc cú pháp và hình thái học vào trong các hệ thống thống kê. Tiếng Việt Những năm thập niên 1960 vấn đề dịch tự động cho tiếng Việt đã bắt đầu được nghiên cứu, hầu hết đều do các nguyên nhân chính trị và quân sự. Các tài liệu nước ngoài cho thấy, được sự bảo trợ của Không lực Hoa Kỳ, Bernard E. Scott thành lập công ty Logos vào năm 1969 với mục đích tiếp tục nghiên cứu việc tổ chức hệ thống dịch tự động 2/5

từ tiếng Anh ra tiếng Việt. Scott bắt đầu chuẩn bị cho việc tổ chức hệ thống dịch tự động này vào mùa xuân năm 1965 tại Viện công nghệ máy tính tại New York, Mỹ. Vào khoảng tháng 6 năm 1970 hệ thống dịch tự động có tên Logos I ra đời với từ điển tự động hóa hỗ trợ chỉ có hơn 1.000 từ tiếng Việt, tác giả của hệ thống này là Byrne, Charles E.; Scott, Bernard E.; Binh, Truong N. Nhưng hệ thống này không tồn tại được lâu, việc nghiên cứu của Scott chấm dứt vào năm 1973. Cũng trong khoảng thời gian này, một dự án khác về xây dựng hệ thống dịch tự động từ tiếng Anh ra tiếng Việt đã được tiến hành vào đầu thập niên 1970 tại Tập đoàn viễn thông Xyzyx, California. Hệ thống này đầu tiên được xây dựng để dịch văn bản Anh - Pháp về vũ trụ học trên máy IBM 360 theo nguyên tắc hoạt động tương tự như của hệ thống Logos. Tuy nhiên, hệ dịch máy Anh-Việt được sử dụng rộng rãi tại Việt nam đầu tiên là EVTRAN - 1997. Và sau đó EVTRAN 2.0, 1999 với hơn 200.000 từ và cụm từ. Từ năm 2006, bản EVTRAN 3.0 (được gọi là Ev-Shuttle) biên dịch văn bản hai chiều Anh-Việt và Việt-Anh (với hơn 500.000 mục từ vựng). Một số dịch vụ dịch tự động Đa ngôn ngữ Babel Fish: Một trong các tiện ích dịch tự động đầu tiên trên ứng dụng web, được công cụ tìm kiếm Alta Vista phát triển và đưa lên mạng vào năm 1997, sau đó Yahoo một công cụ tìm kiếm khác mua lại vào năm 2004. Hỗ trợ 38 cặp ngôn ngữ, trong đó tiếng Anh, tiếng Pháp và tiếng Trung Quốc (cả giản thể và phồn thể) được hỗ trợ nhiều nhất; tiếp đến là các tiếng Đức, Tây Ban Nha, Ý, Bồ Đào Nha, Nga, Triều Tiên, Nhật, Hy Lạp và Hà Lan. Liên kết: babelfish.yahoo.com Google Translate: Dịch vụ này tính đến thời điểm tháng 2 năm 2010 đã hỗ trợ 52 ngôn ngữ trong đó có tiếng Việt, hiện là dịch vụ trực tuyến duy nhất hỗ trợ khả năng dịch toàn trang web cho tiếng Việt, không giống Yahoo, do sử dụng kiểu dịch trung gian nên cặp ngôn ngữ có khả năng dịch qua lại với nhau lên tới con số 1326 (52*51/2), tuy nhiên rất nhiều cặp chất lượng dịch thấp, vì thực tế đó là kiểu dịch tự động 2 lần qua một ngôn ngữ trung gian nào đó (thường là tiếng Anh), với tính năng này có thể dịch một câu tiếng Việt sang 51 ngôn ngữ còn lại. Có tính năng tương tác với người dùng nhằm tăng chất lượng dịch cho các lần sau, không hỗ trợ dịch chuyên ngành. Tốc độ dịch của Google là rất tốt so với các dịch vụ trực tuyến tương tự khác dành cho người Việt, khi sử dụng người dùng sẽ dễ dàng nhận thấy. Tốc độ, đơn giản dù sao vẫn là những đặc điểm vốn có từ lâu của người khổng lồ Internet này. Liên kết: translate.google.com.vn Tiếng Việt Dịch máy trên Xalo.vn: đưa ra dịch vụ dịch trực tuyến một chiều từ Anh sang Việt, do công ty Cổ phần Công nghệ Tinh Vân tự phát triển, hỗ trợ dịch theo từng lĩnh vực, đồng 3/5

thời cho phép người dùng chỉnh sửa, góp ý về nội dung dịch nhằm nâng cao chất lượng dịch. Liên kết: dich.xalo.vn Lạc Việt (công ty từng phát triển và đưa ra bộ từ điển Lạc Việt): chỉ hỗ trợ dịch từ Anh sang Việt có thêm phần dịch chuyên ngành (tin học, toán học, y học và kế toán) và hỗ trợ dịch tốt hơn bởi người dùng. Liên kết: www.vietgle.vn/tratu/dich-tu-dong Vdict: Dịch vụ trực tuyến đầu tiên dịch tự động Anh-Việt, mua lại bản quyền phần mềm EVTRAN của Softex (Phòng Công nghệ Phần Mềm - Viện Ứng dụng công nghệ - Bộ Khoa học và Công nghệ Việt Nam) phát triển, sau đó từ bỏ phần mềm này (trong một thời gian ngắn) để sử dụng công nghệ của Google Translate. Tuy nhiên, vì trong nhiều trường hợp EVTRAN dịch tốt hơn Google Translate nên Vdict đã sử dụng lại EVTRAN đồng thời với Google Translate: hiện nay khi dịch Anh<->Việt, vdict cho ra cả hai kết quả. Không hỗ trợ dịch chuyên ngành cũng như trợ giúp từ phía người dùng. Liên kết: vdict.com/?autotranslation Baamboo: Dịch dưới 500 từ được hỗ trợ bởi Google. Hạn chế Do chất lượng chưa thật tốt nên hầu hết các sản phẩm dịch tự động đều chỉ mang tính tham khảo, các bản dịch chỉ cho biết đại ý và nó hoàn toàn có thể dịch sai một phần hoặc toàn bộ nội dung cốt lõi của văn bản. Trong quá trình dịch thuật nếu lạm dụng dịch tự động sẽ làm ảnh hưởng nghiêm trọng đến văn phong, bởi vì người dịch giữ nguyên cách hành văn của bản dịch nhưng cách hành văn này thường không chính xác, máy móc và thiếu "chất người". So sánh giữa các thể loại văn bản khác nhau cho thấy dịch tự động dịch tài liệu chuyên ngành có chất lượng tốt nhất, nguyên nhân là vì các tài liệu này từ vựng có nghĩa rõ ràng (đơn nghĩa), cấu trúc ngữ pháp mạch lạc, đơn giản, ngược lại thể loại văn học là khó dịch nhất vì từ thường đa nghĩa, nhiều khẩu ngữ, cấu trúc ngữ pháp phức tạp, hay sử dụng nghĩa bóng. Dịch chuyên ngành và dịch chung Một số chương trình dịch máy cho phép lựa chọn dịch chuyên ngành và dịch chung. Với một văn bản chuyên ngành, từ vựng thường có hai nghĩa, nghĩa thứ nhất là nghĩa chuyên ngành và nghĩa thứ hai là nghĩa vẫn hay được sử dụng, việc người dùng lựa chọn thể loại của văn bản giúp hệ thống giảm bớt gánh nặng xử lý các hiện tượng nhập nhằng, kết quả là tốc độ cũng như chất lượng được gia tăng. Tuy nhiên khi sử dụng tính năng này cần thận trọng, đặc biệt trong các văn bản có tính chất liên ngành, ví dụ như khi dịch một tài liệu về xử lý ngôn ngữ tự nhiên và xếp nó vào chuyên ngành tin học chưa chắc đã cho kết quả dịch tốt hơn, nguyên nhân là vì xử lý ngôn ngữ tự nhiên còn là sự kết hợp giữa các ngành ngôn ngữ, toán học chứ không đơn giản là thuần túy tin học. Một 4/5

chương trình dịch tự động chất lượng cao sẽ tự động nhận diện thể loại mà không cần sự trợ giúp từ con người. Đánh giá sản phẩm Khi các dịch vụ dịch tự động gia tăng lên tới hàng chục (như các dịch vụ dịch tự động từ tiếng Anh sang tiếng Pháp) thì một yêu cầu được đưa ra là cần phải lựa chọn dịch vụ nào tốt nhất. Việc đánh giá chất lượng của một sản phẩm không thể căn cứ trên vài thí nghiệm đơn giản, do vậy các chuyên gia đã thiết kế hẳn một chương trình đánh giá chuyên nghiệp một cách hoàn toàn tự động. Phương pháp của họ là sử dụng một số lượng lớn các tài liệu dịch bởi con người và đã được thẩm định đạt chất lượng, sau đó so sánh các bản dịch này với bản dịch của máy, tỉ lệ so khớp cho kết quả phù hợp càng cao thì sản phẩm đó càng tốt. Hai phương pháp thường sử dụng để đánh giá đó là BLEU (BiLingual Evaluation Understudy) và NIST (National Institute of Standards and Technology) 5/5