DolphinGemma: Terobosan AI Google untuk Pahami Lumba-Lumba


Ilustrasi DolphinGemma

Ilustrasi DolphinGemma

Selama bertahun-tahun, para ilmuwan hanya bisa menyimak suara klik, siulan, dan denyut-denyut misterius yang dikeluarkan oleh lumba-lumba tanpa benar-benar memahami maksud di balik suara tersebut. Namun, apa jadinya jika kita tidak hanya bisa mendengarkan, tapi juga memahami pola komunikasi kompleks mereka, bahkan merespons dengan cara yang mereka pahami? Inilah lompatan besar yang sedang dicapai oleh Google melalui proyek ambisius bernama DolphinGemma, sebuah model kecerdasan buatan (AI) yang dirancang untuk mempelajari dan meniru bahasa lumba-lumba.

Pada Hari Lumba-lumba Nasional, Google mengumumkan kolaborasi besarnya dengan para peneliti dari Georgia Institute of Technology dan Wild Dolphin Project (WDP). Mereka mengembangkan model AI dasar yang mampu memahami struktur vokalisasi lumba-lumba dan menghasilkan rangkaian suara baru yang terdengar alami seperti suara lumba-lumba itu sendiri. Teknologi ini bukan hanya pencapaian dalam bidang AI, melainkan juga menjanjikan terobosan besar dalam komunikasi antarspesies.

 

Menyelami Dunia Lumba-lumba Lewat Penelitian Lapangan

Untuk memahami makhluk laut secerdas lumba-lumba, konteks sosial dan perilaku mereka sangat penting. Di sinilah peran Wild Dolphin Project (WDP) menjadi krusial. Sejak tahun 1985, WDP telah menjadi pelopor dalam penelitian bawah laut terhadap komunitas lumba-lumba tutul Atlantik liar (Stenella frontalis) di perairan Bahama. Selama hampir 40 tahun, mereka melakukan pengamatan mendalam, menghasilkan koleksi data yang sangat kaya berupa video dan rekaman audio bawah laut yang terhubung dengan identitas masing-masing lumba-lumba serta perilaku sosialnya.

Yang membedakan pendekatan WDP adalah prinsip mereka: “In Their World, on Their Terms” Artinya, mereka menghindari metode invasif dan fokus pada pengamatan alami di habitat asli lumba-lumba. Hal ini memungkinkan pencatatan langsung jenis suara yang dikeluarkan lumba-lumba dalam konteks tertentu, misalnya:

  • Siulan khas: seperti "nama panggilan" yang digunakan induk dan anak lumba-lumba untuk saling menemukan.
  • Suara “squawk”: terdengar selama konflik atau perkelahian.
  • Klik “buzz”: sering muncul saat pacaran atau mengejar hiu.

Dengan mengenali suara dan konteks perilakunya, peneliti berharap bisa memetakan pola komunikasi yang menyerupai bahasa. Namun, tugas ini memerlukan upaya besar dan waktu yang sangat lama, di sinilah teknologi AI seperti DolphinGemma berperan.

 

DolphinGemma: Model AI untuk Memahami Bahasa Lumba-lumba

Google mengembangkan DolphinGemma dengan memanfaatkan teknologi audio mutakhir mereka. Model ini dibangun berdasarkan SoundStream tokenizer, sistem yang mampu merepresentasikan suara secara efisien dan akurat, khususnya suara kompleks seperti vokalisasi lumba-lumba.

DolphinGemma memiliki parameter sekitar 400 juta, menjadikannya cukup ringan untuk dijalankan langsung di perangkat mobile seperti Google Pixel yang digunakan para peneliti WDP di lapangan. Meskipun ringan, model ini sangat canggih dan mampu memproses urutan suara lumba-lumba untuk mengenali pola, menyusun struktur suara, dan bahkan memprediksi suara selanjutnya, mirip seperti bagaimana model bahasa AI memprediksi kata berikutnya dalam kalimat manusia.

Model ini dikembangkan berdasarkan teknologi Gemma, koleksi model AI terbuka milik Google yang juga digunakan dalam pengembangan Gemini, sistem AI unggulan perusahaan. DolphinGemma dilatih secara ekstensif menggunakan database akustik WDP, sehingga sangat akurat dalam memahami struktur vokalisasi lumba-lumba tutul Atlantik.

 

Menguak Struktur Komunikasi dan Membangun Kosakata Bersama

DolphinGemma mulai digunakan oleh tim WDP pada musim penelitian tahun ini. Hasil awal menunjukkan bahwa model ini mampu mengidentifikasi pola suara yang berulang, pengelompokan suara, dan urutan vokalisasi yang sebelumnya sangat sulit dikenali oleh peneliti manusia secara manual.

Model ini berpotensi mengungkap struktur tersembunyi dalam komunikasi lumba-lumba, langkah pertama menuju pemahaman lebih dalam tentang "bahasa" mereka. Lebih jauh lagi, DolphinGemma dapat digunakan untuk menciptakan suara sintetis yang dirancang untuk merujuk pada objek tertentu yang disukai lumba-lumba, seperti rumput laut atau mainan buatan peneliti. Jika lumba-lumba bisa merespons suara ini, maka interaksi dua arah bisa dimulai.

 

Sistem CHAT: Komputer Bawah Air untuk Interaksi Dua Arah

Selain mendalami komunikasi alami, tim peneliti juga mengembangkan sistem unik bernama CHAT (Cetacean Hearing Augmentation Telemetry): sebuah komputer bawah laut yang dirancang untuk menciptakan kosakata bersama antara manusia dan lumba-lumba.

CHAT tidak mencoba menerjemahkan bahasa lumba-lumba secara langsung. Sebaliknya, sistem ini menciptakan siulan sintetis yang dihubungkan dengan objek tertentu.

Contohnya, jika siulan “A” dikaitkan dengan sepotong sargassum (sejenis rumput laut), maka peneliti berharap lumba-lumba akan meniru siulan itu untuk meminta objek tersebut.

Agar sistem ini efektif, CHAT harus mampu:

  1. Mendeteksi siulan tiruan di tengah kebisingan lautan.
  2. Mengidentifikasi siulan mana yang ditiru.
  3. Menginformasikan peneliti (melalui headphone tahan air) tentang objek yang "diminta".
  4. Memungkinkan peneliti merespons cepat dengan memberikan objek tersebut, memperkuat interaksi.

Perangkat Google Pixel 6 digunakan untuk menjalankan analisis suara secara real time dengan fidelitas tinggi. Rencana ke depan bahkan lebih menarik, Google Pixel 9 dijadwalkan akan digunakan dalam ekspedisi 2025 dengan kemampuan pemrosesan lebih canggih dan fungsi speaker/mikrofon terintegrasi, memungkinkan sistem belajar dan merespons dengan lebih baik.

Inovasi Teknologi Lapangan yang Efisien

Penggunaan ponsel pintar seperti Pixel dalam penelitian bawah laut menawarkan sejumlah keuntungan besar:

  1. Mengurangi kebutuhan perangkat keras khusus yang mahal dan sulit dirawat.
  2. Menurunkan konsumsi daya, sangat penting dalam kondisi lapangan.
  3. Meningkatkan efisiensi dan mobilitas, karena peneliti hanya perlu membawa ponsel, bukan alat berat.
  4. Menurunkan biaya dan ukuran perangkat, sangat bermanfaat dalam penelitian di laut lepas.

Dengan kemampuan DolphinGemma dalam memprediksi tiruan suara dan meningkatkan kecepatan reaksi peneliti, sistem ini bisa menciptakan interaksi dua arah yang lebih alami, efisien, dan bermakna.

 

Kolaborasi Global dan Masa Depan Penelitian Antarspesies

Menyadari pentingnya kerja sama dalam dunia ilmiah, Google berencana membagikan DolphinGemma sebagai model terbuka pada musim panas mendatang. Meskipun model ini dilatih dengan suara lumba-lumba tutul Atlantik, para peneliti percaya bahwa ia juga bisa digunakan untuk mempelajari spesies lain seperti lumba-lumba hidung botol atau lumba-lumba pemintal, dengan sedikit penyesuaian.

Dengan membagikan model ini ke komunitas ilmiah global, Google dan mitra peneliti berharap para ilmuwan dari berbagai negara bisa menggali data akustik lokal mereka sendiri, mempercepat pemahaman kita secara kolektif tentang komunikasi antar makhluk hidup.

 

Kesimpulan

Proyek DolphinGemma adalah contoh nyata bagaimana teknologi AI dapat melampaui batas-batas konvensional dan membantu manusia menjelajahi dimensi baru dalam hubungan dengan alam. Kita tidak lagi sekadar menjadi pendengar pasif dari suara-suara lautan.

Kini, dengan kombinasi penelitian lapangan yang mendalam, rekayasa teknologi mutakhir, dan kekuatan AI, kita mulai memahami pola komunikasi yang tersembunyi dan membayangkan masa depan di mana manusia dan lumba-lumba bisa berbicara dalam bahasa yang sama.

Ini bukan hanya revolusi dalam teknologi, melainkan juga langkah besar menuju hubungan emosional dan intelektual yang lebih dalam antara manusia dan makhluk cerdas lain di planet ini.

Bagikan artikel ini

Komentar ()

Video Terkait