Wikidata:WikiProject Indonesia/Kegiatan/DILEMA Maret 2023

From Wikidata
Jump to navigation Jump to search

Pada tanggal 18 Maret 2023, tim PPLL (Pengembangan Perangkat Lunak dan Leksem) Wikimedia Indonesia telah mengadakan acara DILEMA (diskusi leksem bersama) yang dihadiri oleh lima pembicara dari latar belakang yang berbeda, yakni dari komunitas Wikidata Leksem, linguistik, praktisi, dan ilmu komputer. Acara DILEMA juga dihadiri oleh anggota komunitas dari berbagai proyek wiki. Terdapat tiga agenda utama dalam acara DILEMA, yaitu pemberitahuan aktivitas terkini proyek PPLL, paparan mengenai konsensus penerjemahan istilah di Wikidata Leksem, dan tanya jawab serta diskusi. Berikut merupakan rangkuman dari ketiga agenda tersebut.

Pemberitahuan aktivitas terkini proyek PPLL[edit]

Sepanjang bulan Juli hingga Desember 2022, PPLL telah melakukan riset terhadap pengguna Wikidata di Indonesia. Proses riset ini telah menghasilkan tiga laporan riset, satu dokumen profil pengguna, dan satu dokumen pendukung riset. Seluruh dokumen dipublikasikan secara dwibahasa, bahasa Indonesia dan bahasa Inggris. Dokumen ini dapat teman-teman akses melalui pranala berikut.

PPLL telah melakukan tiga hal utama sebagai tindak lanjut dari hasil riset, yakni

  • eksplorasi pascariset pada beberapa proyek Wikimedia dan beberapa perkakas, seperti Wikipedia, Wikikamus, Wikisumber, Wikistories, Wikimedia Commons, Incubator, perkakas Lingua Libre, ISA, serta halaman WikiProject sebagai salah satu elemen penting yang menggerakkan proyek wiki;
  • komunikasi dengan pengembang Wikidata dari Wikimedia Deutschland dan mitra luar; dan
  • diskusi dengan komunitas.

Paparan mengenai konsensus penerjemahan istilah di Wikidata Leksem[edit]

Raisha Abdillah (Manajer Proyek PPLL)[edit]

Wikidata Leksem bahasa Indonesia masih memiliki beberapa elemen yang belum diterjemahkan ke dalam bahasa Indonesia, seperti Language, Lexical category, Senses, dan Forms. Wikidata Leksem merupakan proyek bersama, karenanya, penerjemahan elemen ini membutuhkan kesepakatan dari komunitas. Sebagaimana proyek-proyek wiki lainnya, Wikidata Leksem memerlukan adanya perumusan konsensus.

Selain penerjemahan, hal lainnya yang perlu ditentukan adalah arahan proyek. Dari kondisi Wikidata Leksem saat ini, kita melihat bersama-sama bahwa proyek Wikidata Leksem merupakan proyek yang melibatkan aspek komunitas, linguistik, dan teknologi. Hal ini dapat kita ejawantahkan dalam sebuah spektrum antara teoretis dan praktis.

Benny (Kontributor Wikidata Leksem bahasa Indonesia)[edit]

Pertama-tama, izinkan saya membuat prediksi kecil. Di masa mendatang, orang akan memperingati 30 November 2022 sebagai awal mula sebuah revolusi internet, sebuah hari yang mengubah cara orang mencari, mendapatkan, dan memproses informasi melalui ChatGPT. Saat ini (14 Maret 2023), ChatGPT sudah bisa memproses dan mengenali gambar, tidak hanya teks. ChatGPT menggunakan berbagai sumber data dan pengetahuan, termasuk Wikidata, untuk mengembangkan pelatihan dan pembelajarannya. Berangkat dari sana, saya dan banyak orang lain percaya bahwa di masa depan Wikidata akan memainkan peranan penting dalam revolusi internet. Hal itu menjadi informasi latar untuk memahami konteks di mana Wikidata berada saat ini dan apa peranannya di tengah kemajuan teknologi yang begitu pesat.

Terkait konsensus penerjemahan istilah di Wikidata Leksem bahasa Indonesia, saya sudah memberikan pandangan di halaman pembicaraan WikiProject Indonesia.

  • Senses menurut saya tidak masalah mau diterjemahkan menjadi makna, arti, dan masih bersinonim dengan meaning, dan berhubungan dengan definition, atau definisi.
  • Forms diterjemahkan sebagai bentukan, karena plural “bentuk-bentuk” kurang tepat, dan singular “bentuk” juga tidak tepat.
  • Lexical category ini yang perlu didiskusikan lebih lanjut. Di halaman pembicaraan sudah dituliskan panjang lebar, mengapa hal ini dibedakan dengan kelas kata.
  • Istilah-istilah lain yang perlu diterjemahkan, seperti grammatical features, gloss, beserta perbedaan antara gloss, senses, meaning, dan representation.

Bagi saya, pemilihan terjemahan atau padanan kata merupakan sesuatu yang luwes, bukan sesuatu yang kaku. Lebih baik memilih padanan yang lebih mudah dipahami yang pada hakekatnya sama dengan konsep yang dijelaskan tanpa harus terikat oleh istilah bahasa Inggrisnya. Mana yang lebih dipahami oleh non-linguis? Kelas kata atau kategori leksikal?

Sediakan definisi dari ketiga istilah tersebut. Ini nanti perlu diletakkan di tempat yang mudah dicari oleh kontributor kita. Menurut saya, definisi lebih penting dari terjemahannya, karena tidak dibatasi pada satu atau dua kata saja. Kita juga harus mengandalkan beberapa sumber, tidak cuma kamus linguistik saja.

Usulan saya adalah mumpung kita sedang menerjemahkan istilah, mari kita buat sekaligus definisi istilah-istilahnya, sesuai dengan de facto di Wikidata saat ini. Apa definisi ketiga istilah itu menurut tim pengembang Wikidata Lexeme (bahasa Inggris)? Itulah yang perlu kita terjemahkan dan adopsi. Selain definisi, kita juga perlu menjabarkan apa saja yang bisa masuk ke Forms di Wikidata. Apabila diperlukan, pendefinisian istilah-istilah seperti 'kelas kata' bisa diperluas untuk mencakup kelas prakategorial, dan non-kata, tidak harus terikat makna di kamus linguistiknya.

Kendala selama mengembangkan proyek Wikidata Leksem bahasa Indonesia sebagian besar sudah saya dokumentasikan di: Wikidata:Lexicographical_data/Documentation/Languages/id

Berikut adalah beberapa kendala yang telah saya cantumkan

  • Leksem: Kita memiliki banyak varian ejaan seperti informal, pengucapan huruf dan lain sebagainya, lalu bagaimana mengakomodir leksem-leksem ini?
  • Statements: Belum ada standardisasi apa saja yang digunakan dan yang diperlukan.
  • Forms: Masing-masing dari lexical category/kelas kata perlu dibahas lebih lanjut. Apa saja item-item (butir data) yang bisa dijadikan penjelasan.

Harapan untuk Wikidata Leksem dan komunitas Wikidata Leksem

  • Harapan saya adalah setiap bahasa di Indonesia nantinya akan dapat memiliki data leksem yang lengkap di Wikidata. Ada komunitas-komunitas penutur dari masing-masing bahasa yang mengambil bagian aktif dan difasilitasi dengan tutorial dan ruang maya yang suportif.
  • Wikidata Leksem mengakomodasi fitur-fitur bahasa Austronesia, seperti afiksasi, reduplikasi, kata dasar prakategorial, multi-aksara, dll.
  • Ada cara mudah untuk menambahkan leksem dan sense/makna dalam jumlah yang banyak, misalnya dengan Wikidata Lexeme Forms yang telah dimodifikasi untuk bahasa Indonesia dan bahasa-bahasa daerah.
  • Ada cara mudah untuk menyunting leksem dalam jumlah yang banyak, misalnya jika ada bentuk yang sebelumnya tidak tercakup, menambah senses, dan lain-lain, misalnya Machtsinn.
  • Topik leksem diangkat/disosialisasikan ke level komunitas nasional, misalnya di WikiNusantara.
  • Penggunaan leksem secara praktis, mungkin dibuat menjadi sebuah direktori atau katalog produk dan semacamnya. Sembilan belas ribu lebih leksem ini mau dibawa ke mana?

Fariz Darari (Dosen Fasilkom Universitas Indonesia)[edit]

Wikidata Leksem dapat menjadi momen untuk menunjukkan pentingnya sebuah bahasa. Berbahasa juga seharusnya dapat memanfaatkan teknologi. Penggunaan istilah di Wikidata Leksem bahasa Inggris kita asumsikan sudah oke.

Contoh yang menarik adalah homograph lexeme. Untuk bahasa Indonesianya, bisa ditambahkan statements atau pernyataannya.

Di dalam Forms ada grammatical features yang dapat membantu orang yang ingin belajar bahasa Indonesia dan membantu memberikan konteks ke mesin, misalnya ChatGPT. Inisiasi di Wikidata Leksem ini harapannya dapat menjadi penyeimbang.

Melalui Senses kita tahu dari satu leksem bisa ada beberapa makna. Saya juga mencoba kueri untuk Wikidata Leksem. Kita harus perhatikan kira-kira pemanfaatannya apa, baik dari segi peneliti maupun masyarakat umum.

Di contoh kueri kata benda dalam bahasa Indonesia yang diawali dengan huruf “m”, kita bisa langsung melihat hasil yang ditampilkan. Dengan adanya kueri ini kita jadi tau, sudah lengkap belum? Masalah kualitas data sudah benar belum?

Kueri lima teratas kata benda terpanjang di bahasa Indonesia dapat digunakan sebagai kuis di Wikidata Leksem. Apakah leksem-leksem kata benda terpanjang ini sering dipakai?

Kueri senses untuk leksem 'anak' dapat menampilkan informasi leksem yang menjelaskan makna dari leksem 'anak'. Kamus dapat kita perkaya lagi dan komunitasnya kita apresiasi agar bahasa-bahasa yang ada, terutama di daerah dapat dilestarikan.

Taufik Rosman (Kontributor Wikidata Leksem bahasa Melayu)[edit]

Saat ini tidak terlalu banyak penyunting yang berkontribusi di Wikidata Leksem bahasa Melayu. Leksem di bahasa Melayu hingga saat ini mencapai 2.500 leksem. Di bahasa Melayu kami menggunakan kategori leksikal yang telah ditetapkan oleh badan bahasa dan pustaka kami. Kalau kelas kata kami padankan dengan part of speech. Menurut pandangan saya, kelas kata itu sedikit terbatas, contohnya seperti verba, nomina, kata kerja, kata sifat, yang telah ditetapkan oleh badan bahasa. Sedangkan kategori leksikal lebih ke arah lingusitik. Bagi saya kelas kata lebih tradisional maksudnya dan tidak begitu luas artinya dibandingkan kategori leksikal. Dalam buku Tata Bahasa Baku Bahasa Indonesia Edisi Keempat, mereka menyebutnya kategori leksikal.

Kendala dalam komunitas Wikidata Leksem bahasa Melayu:

  • Kurangnya anggota dalam menyunting leksem di bahasa Melayu. Hal itu dikarenakan karena ketidaktahuan anggota dalam menyunting leksem.
  • Belum pastinya format tata cara yang jelas dalam memasukkan leksem. Misalnya, Forms itu dipadankan sebagai bentuk, itu tidak masalah. Masalahnya adalah apa saja yang harus dimasukkan ke dalam Forms bahasa Melayu tersebut.
  • Kekurangan sumber terbuka, karena bahan-bahan bahasa baku yang ada masih memiliki hak cipta, sedangkan untuk Wikidata Leksem menggunakan CC0. Kalau Senses, kami memadankannya sebagai maksud. Karena masalah-masalah tersebut kami terkendala memasukkan Senses dalam bahasa Melayu, sehingga kami terpaksa menggunakan Senses dalam bahasa Inggris atau bahasa lainnya.

Arahan proyek teoretis dan praktis itu menurut saya tergantung ke komunitas. Terkait penerjemahan istilah di Wikidata Leksem ke rumpun bahasa Indonesia, apakah penerjemahannya nantinya akan sesuai bagi rumpun bahasa lain seperti Indo-Eropa? Peluang di masa mendatang, kita juga bisa masukkan kueri dalam Wikidata Leksem nantinya seperti kueri kata benda terpanjang. Di Wikidata Leksem bahasa Melayu, kami juga memasukkan leksem dalam aksara Jawi, ke depannya mungkin kami akan menambahkan aksara lainnya. Aksara lokal tersebut dapat kita pelihara agar tidak punah.

Ivan Lanin (Direktur Narabahasa)[edit]

Sejak 2016, orang Indonesia sudah terbiasa menggunakan KBBI daring. Kalau kita mengikuti dari situs KBBI daring, Senses dapat diartikan sebagai makna. Ragam bisa kita isi dengan statements yang berguna ketika menggunakan kueri. Kalau Lexical category, dapat menggunakan kelas kata.

Di luar dari pertimbangan-pertimbangannya, berikut adalah saran dari saya untuk penerjemahan istilah di Wikidata Leksem bahasa Indonesia

  • Lemma = Lema,
  • Lexical category = Kelas kata,
  • Language = Bahasa,
  • Statements = Pernyataan,
  • Forms = Bentuk,
  • Representation = Representasi,
  • Grammatical features = Fitur gramatikal,
  • Senses = Makna, dan
  • Gloss = Glosa.

Masukan untuk Wikidata Leksem:

  • Berdasarkan pertimbangan linguistik, satu kata dapat dimasukkan dalam lebih dari satu kelas kata dan ada entri yang bukan “kata”: prefiks, klitik, bentuk terikat, partikel, prakategorial.
  • Pengembangan kueri yang berguna dan menarik untuk publik: Padanan kata bahasa Indonesia—bahasa Inggris, bahasa Indonesia—bahasa daerah, daftar kata berdasarkan bidang (sastra, komputer, dll.), dan tesaurus (sinonim, antonim, hipernim, hiponim, dsb.).
  • Pencarian khusus berdasarkan makna (kamus balik/reverse dictionary) dan berdasarkan rima.
  • Pengelompokan kata berdasarkan tingkat pemelajar (dasar, menengah, mahir).

Felicia N. Utorodewo (Konsultan bahasa)[edit]

Kita memang mengikuti pola pikiran dari Barat ketika membuat Wikidata yang menggunakan kaidah bahasa Barat, khususnya bahasa Inggris. Menurut saya, kita tidak perlu terlalu galau menghadapi masalah bentuk derivasional dan infleksional. Pengguna bebas memilih kaidah yang ingin digunakannya sesuai dengan perilaku kebahasaan kita.

Permasalahannya ada di masalah pelafalan, belum lagi sekarang ada monofon. Itu harus disepakati dulu, tim Wikidata dapat menentukannya sendiri tanpa menunggu Badan Bahasa terlebih dahulu.

Dalam bahasa Indonesia terdapat banyak ragam bahasa, itu pun harus kita payungi. Menurut saya, sebaiknya kita mencari istilah linguistik yang bersifat universal yang dapat dimengerti oleh orang awam namun tidak terlalu sulit bagi pengguna bahasa yang secara praktis menggunakan Wikidata Leksem.

Dalam bahasa, ada namanya laras bahasa yang setiap laras memiliki kosa kata atau medan maknanya tersendiri. Dari pengetahuan laras tersebut, kita dapat mengetahui mengenai format, kelas kata, dan banyak hal lainnya.

Pesan untuk Wikidata Leksem bahasa Indonesia dan tim PPLL:

  • Kita harus memahami dulu perilaku bahasa kita dan penamaan apa yang berlaku. Kita harus menetapkan diri menggunakan klasifikasi kata yang mana, yang digunakan oleh siapa, dan secara konsisten mengikuti apa yang dipilih tersebut.
  • Kita tidak perlu terlalu takut kepada peristilahan, asalkan kita berlaku konsisten, dan memberikan glosari. Kita harus bersama-sama memilih teori atau konsep yang terbaik untuk Wikidata Leksem, sehingga dapat menjalankan fungsinya sebagai pengumpul atau pengolah kata.

Tanya jawab dan diskusi[edit]

Semua pertanyaan yang diajukan dalam diskusi acara DILEMA bulan Maret 2023 beserta ringkasan jawabannya dapat teman-teman akses melalui dokumen berikut.

Berikut pranala-pranala terkait acara DILEMA bulan Maret 2023

Apabila teman-teman memiliki pertanyaan ataupun tanggapan terkait rangkuman acara ini, mohon sampaikan melalui halaman pembicaraan, ya.

Terima kasih!