Suara.com - Desainer alat terjemahan mesin masih sangat bergantung pada kamus untuk membuat bahasa asing dapat dimengerti. Tapi sekarang ada cara baru, yakni dengan angka.
Peneliti Facebook mengatakan, mengubah kata menjadi angka dan mengeksploitasi persamaan matematika antara bahasa adalah jalan yang menjanjikan.
Terjemahan otomatis yang kuat adalah prioritas utama bagi raksasa internet. Mengizinkan sebanyak mungkin orang di seluruh dunia untuk berkomunikasi bukan hanya tujuan altruistik, tetapi juga bisnis yang baik.
Facebook, Google dan Microsoft serta Yandex Rusia, Baidu China dan lainnya terus mencari cara untuk meningkatkan alat terjemahan mereka.
Baca Juga: Kirim Pesan Langsung Instagram Bisa Lewat Desktop
Facebook memiliki pakar intelijen buatan yang bekerja di salah satu laboratorium penelitiannya di Paris.
"Hingga 200 bahasa saat ini digunakan di Facebook," kata Antoine Bordes, co-director Eropa untuk penelitian AI dasar untuk jejaring sosial, sebagaimana dilansir laman Japan Today.
Terjemahan otomatis saat ini didasarkan pada memiliki database besar teks identik dalam kedua bahasa untuk bekerja. Tetapi bagi banyak bahasa tidak ada cukup teks paralel seperti itu.
Itu sebabnya para peneliti telah mencari metode lain, seperti sistem yang dikembangkan oleh Facebook yang menciptakan representasi matematika untuk kata-kata.
Setiap kata menjadi "vektor" dalam ruang beberapa ratus dimensi. Kata-kata yang memiliki asosiasi dekat dalam bahasa lisan juga menemukan diri mereka dekat satu sama lain dalam ruang vektor ini.
Baca Juga: Canggihnya Samsung Galaxy A80
"Misalnya, jika Anda menggunakan kata 'kucing' dan 'anjing', secara semantik, kata-kata itu menggambarkan hal yang serupa, sehingga mereka akan sangat dekat satu sama lain secara fisik di ruang vektor," kata Guillaume Lample, salah satu dari sistem desainer.
"Jika Anda mengambil kata-kata seperti Madrid, London, Paris, yang merupakan ibu kota Eropa, itu ide yang sama."
Peta bahasa ini kemudian dapat dihubungkan satu sama lain menggunakan algoritma, pada awalnya. Tetapi akhirnya menjadi lebih disempurnakan, sampai seluruh frasa dapat dicocokkan tanpa terlalu banyak kesalahan.
"Untuk pasangan bahasa Inggris-Rumania, sistem terjemahan mesin Facebook saat ini sama atau mungkin sedikit lebih buruk daripada sistem vektor kata," kata Lample.
"Tetapi untuk pasangan bahasa Inggris-Urdu yang lebih jarang, di mana sistem tradisional Facebook tidak memiliki banyak teks bilingual untuk referensi, sistem vektor kata sudah lebih unggul," katanya.
Tetapi bisakah metode ini memungkinkan terjemahan dari, katakanlah, Basque ke dalam bahasa suku Amazon?
Secara teori, ya, kata Lample, tetapi dalam praktiknya diperlukan sejumlah besar teks tertulis untuk memetakan bahasa tersebut, sesuatu yang kurang dalam bahasa suku Amazon.
"Jika Anda hanya memiliki puluhan ribu frasa, itu tidak akan berhasil. Anda perlu beberapa ratus ribu," katanya.
Para ahli di pusat ilmiah nasional CNRS Prancis mengatakan pendekatan Lample telah diambil untuk Facebook dapat menghasilkan hasil yang bermanfaat, bahkan jika itu tidak menghasilkan terjemahan yang sempurna.
Thierry Poibeau dari laboratorium Lattice CNRS, yang juga melakukan penelitian dalam terjemahan mesin, menyebut pendekatan vektor kata "revolusi konseptual".
Francois Yvon, seorang peneliti di Laboratorium Ilmu Komputer CNRS untuk Mekanik dan Ilmu Teknik, mengatakan bahwa menghubungkan bahasa jauh lebih sulit ketika mereka jauh dari satu sama lain.
"Cara menunjukkan konsep dalam bahasa Cina sama sekali berbeda dari bahasa Prancis," tambahnya.
Namun, bahkan terjemahan yang tidak sempurna pun bisa bermanfaat, kata Yvon, dan dapat membuktikan cukup untuk melacak ucapan kebencian, prioritas utama bagi Facebook.