Memandangkan Samsung terus merintis pengalaman AI mudah alih premium, kami melawat pusat Penyelidikan Samsung di seluruh dunia untuk mengetahui cara Galaxy AI membolehkan lebih ramai pengguna memaksimumkan potensi mereka.
Galaxy AI kini menyokong 16 bahasa, jadi lebih ramai orang boleh mengembangkan keupayaan bahasa mereka, walaupun semasa di luar talian, terima kasih kepada terjemahan pada peranti dalam ciri seperti Terjemah Langsung, Jurubahasa dan Bantuan Nota.
Tetapi apakah yang melibatkan pembangunan bahasa AI? Siri ini mengkaji cabaran bekerja dengan AI mudah alih dan cara kami mengatasinya. Mula-mula, kami menuju ke Indonesia untuk belajar di mana seseorang mula mengajar AI untuk bercakap bahasa baharu.
Langkah pertama ialah menetapkan sasaran, menurut pasukan di Samsung R&D Institute Indonesia (SRIN). “AI yang hebat memulakan data yang berkualiti dan relevan. Setiap bahasa menuntut cara yang berbeza untuk memproses ini, jadi kami menyelami lebih mendalam untuk memahami keperluan linguistik dan keadaan unik negara kita,” kata Junaidillah Fadlil, ketua AI di SRIN, yang pasukannya baru-baru ini menambah sokongan Bahasa Indonesia (Bahasa Indonesia) kepada Galaxy AI.
“Pembangunan bahasa tempatan perlu diterajui oleh wawasan dan sains, jadi setiap proses untuk menambahkan bahasa pada Galaxy AI bermula dengan kami merancang maklumat yang kami perlukan dan boleh diperolehi secara sah dan beretika.”
Ciri AI Galaxy seperti Terjemahan Langsung melakukan tiga proses teras: pengecaman pertuturan automatik (ASR), terjemahan mesin saraf (NMT) dan teks ke pertuturan (TTS). Setiap proses memerlukan satu set maklumat yang berbeza.
ASR, sebagai contoh, memerlukan rakaman pertuturan yang meluas dalam pelbagai persekitaran, setiap satu dipasangkan dengan transkripsi teks yang tepat. Tahap hingar latar belakang yang berbeza-beza membantu mengambil kira persekitaran yang berbeza. “Ia tidak mencukupi hanya untuk menambah bunyi pada rakaman,” jelas Muchlisin Adi Saputra, ketua ASR pasukan. “Selain data bahasa yang kami peroleh daripada rakan kongsi pihak ketiga yang sah, kami mesti keluar ke kedai kopi atau persekitaran kerja untuk merakam suara kami sendiri. Ini membolehkan kami menangkap bunyi unik dari kehidupan sebenar secara sahih, seperti orang yang memanggil atau bunyi papan kekunci yang berbunyi.”
Sifat bahasa yang sentiasa berubah juga mesti diambil kira. Saputra menambah: “Kami perlu mengikuti perkembangan slanga terkini dan cara ia digunakan, dan kebanyakannya kami menemuinya di media sosial!”
Seterusnya, NMT memerlukan data latihan terjemahan. “Menterjemah Bahasa Indonesia adalah mencabar,” kata Muhamad Faisal, ketua pasukan NMT. “Penggunaan luas makna kontekstual dan tersiratnya bergantung pada isyarat sosial dan situasi, jadi kami memerlukan banyak teks terjemahan yang boleh dirujuk oleh AI untuk perkataan baharu, perkataan asing, kata nama khas dan simpulan bahasa – sebarang maklumat yang membantu AI memahami konteks dan peraturan komunikasi.”
TTS kemudiannya memerlukan rakaman yang meliputi julat suara dan nada, dengan konteks tambahan tentang cara bahagian perkataan berbunyi dalam keadaan yang berbeza. “Rakaman suara yang baik boleh melakukan separuh daripada kerja dan merangkumi semua fonem yang diperlukan (unit bunyi dalam pertuturan) untuk model AI,” tambah Harits Abdurrohman, ketua TTS. “Jika seorang pelakon suara melakukan kerja yang hebat pada fasa awal, tumpuan beralih kepada memperhalusi model AI untuk menyebut perkataan tertentu dengan jelas.”
Lebih Kuat Bersama
Ia memerlukan sumber yang besar untuk merancang banyak data, dan SRIN bekerjasama rapat dengan pakar linguistik. “Cabaran ini memerlukan kreativiti, kepintaran dan kepakaran dalam kedua-dua Bahasa Indonesia dan pembelajaran mesin,” kata Fadlil. “Falsafah kerjasama terbuka Samsung memainkan peranan besar dalam menyelesaikan tugas, begitu juga dengan skala operasi dan sejarah pembangunan AI kami.”
Bekerjasama dengan pusat Penyelidikan Samsung lain di seluruh dunia, pasukan SRIN dapat dengan cepat menerima pakai amalan terbaik dan mengatasi kerumitan mewujudkan sasaran data. Tambahan pula, kerjasama adalah baik untuk memajukan bukan sahaja teknologi tetapi juga budaya. Apabila pasukan SRIN menyertai rakan sejawatan mereka di Bangalore, India, mereka mematuhi adat berpuasa tempatan, mewujudkan hubungan yang lebih mendalam dan mengembangkan pemahaman mereka tentang budaya yang berbeza.
Bagi pasukan itu, projek pengembangan bahasa Galaxy AI mengambil makna baharu. “Kami amat berbangga dengan pencapaian kami di sini kerana ini adalah projek AI pertama kami, dan ia bukan yang terakhir kami kerana kami terus memperhalusi model kami dan meningkatkan kualiti output,” Fadlil menyimpulkan. “Perluasan ini bukan sahaja mencerminkan nilai keterbukaan kami tetapi juga menghormati dan menggabungkan identiti budaya kami melalui bahasa.”
Dalam episod seterusnya The Learning Curve, kami akan menuju ke Samsung R&D Institute Jordan untuk bercakap dengan pasukan yang mengetuai projek bahasa Arab Galaxy AI. Ikuti untuk mengetahui tentang kerumitan membina dan melatih model AI untuk bahasa dengan pelbagai dialek.