Deskripsi Pekerjaan
Peran ini menggabungkan keahlian linguistik dengan pemahaman yang mendalam tentang AI dan machine learning untuk mendukung pengembangan dan penyempurnaan keluaran bahasa berkualitas tinggi. Fokusnya adalah mengevaluasi dan meningkatkan konten yang dihasilkan LLM untuk memastikan akurasi, kelancaran, dan relevansi budaya bagi pengguna lokal, sambil bekerja sama erat dengan tim lintas fungsi untuk menyelaraskan kualitas bahasa dengan tujuan proyek yang lebih luas.
Kualifikasi Minimum
1. Mahasiswa tingkat akhir jurusan matematika, ilmu komputer, teknik komputer, dan jurusan terkait lainnya
2. Kemampuan dalam pemrograman Python dan keterampilan pengolahan data dasar.
3. Perhatian terhadap detail, dengan fokus pada menjaga standar kualitas data yang tinggi.
4. Kemampuan komunikasi yang kuat untuk kolaborasi dan dokumentasi yang efektif.
5. Mampu bekerja secara mandiri dan sebagai bagian dari tim.
6. Kemauan untuk belajar dan beradaptasi dalam lingkungan yang serba cepat.
7. Kemampuan untuk memberikan umpan balik yang konstruktif dan berkontribusi dalam diskusi tim.
8. Tersedia untuk masa magang selama 6 bulan.
Tugas dan Tanggung Jawab
1. Memberikan anotasi pada dataset dalam bahasa lokal untuk meningkatkan kemampuan model dalam memproses konten multibahasa.
2. Membersihkan dan melakukan pra-pemrosesan data spesifik bahasa, memastikan input berkualitas tinggi untuk pelatihan.
3. Menganalisis dan mendokumentasikan tata bahasa, sintaksis, dan nuansa budaya yang unik dari bahasa lokal.
4. Identifikasi dan beri anotasi pada ungkapan idiomatik, bahasa gaul, dan istilah spesifik konteks untuk meningkatkan pemahaman model.
5. Mengumpulkan dan memvalidasi data dari berbagai sumber untuk melatih LLM kita.
6. Membantu menyempurnakan LLM untuk bahasa lokal dengan membuat dan memperbaiki kumpulan data pelatihan.
7. Mengembangkan strategi pra-pemrosesan khusus bahasa, seperti tokenisasi atau stemming.
8. Menyusun kumpulan data evaluasi untuk Bahasa Indonesia dan dialek-dialeknya.
9. Meninjau dan mengevaluasi hasil LLM untuk memastikan keakuratan, tata bahasa, dan kesesuaian budaya dalam bahasa setempat.
10. Bertindak sebagai evaluator manusia untuk pengujian model, memastikan hasil yang berkualitas tinggi.
Pendaftaran
Deadline Pendaftaran: –
Link Pendaftaran: https://www.gotocompany.com/careers/adbf6ffa-7f8f-4e45-897c-945ff3a4971f
Departemen Rotasi
Kabinet Catalyst
Himatika UGM