Nova Act: Inovasi Agen AI Mandiri Terbaru dari Amazon


Ilustrasi AI Agents

Ilustrasi AI Agents

Dalam era kecerdasan buatan (Artificial Intelligence/AI) yang berkembang pesat, Amazon memperkenalkan inovasi terbaru yang menjanjikan perubahan besar dalam dunia agen digital: Nova Act. Teknologi ini dirancang untuk menciptakan agen AI yang tidak hanya bisa menjawab pertanyaan, tetapi juga mampu menyelesaikan tugas-tugas digital kompleks secara mandiri di environment web.

Artikel ini akan membahas secara lengkap tentang Nova Act, mulai dari latar belakang pengembangannya, fitur-fitur utama, hingga dampaknya terhadap masa depan agen AI.

 

Apa Itu Agen AI dan Mengapa Penting?

Agen AI, secara sederhana, adalah entitas digital berbasis kecerdasan buatan yang dirancang untuk menjalankan tugas-tugas tertentu secara otomatis. Selama ini, agen AI identik dengan chatbot atau asisten virtual yang menjawab pertanyaan pengguna, mencari informasi, atau memberikan saran berbasis data yang dikumpulkan dari internet. Teknologi seperti ini biasa ditemukan dalam aplikasi seperti Siri, Google Assistant, atau ChatGPT.

Namun, menurut Amazon, konsep ini masih terlalu sempit. Mereka ingin membangun agen yang tidak hanya merespon, tetapi juga bertindak. Dalam visinya, agen AI seharusnya bisa menangani berbagai pekerjaan kompleks seperti:

  • Merencanakan dan menyusun jadwal acara besar (misalnya pernikahan),
  • Menyelesaikan tugas-tugas IT yang rumit,
  • Mengelola proses bisnis yang membutuhkan banyak langkah.

 

Nova Act: Jawaban Amazon atas Keterbatasan Agen AI Saat Ini

Sebagian besar agen AI saat ini memiliki keterbatasan yang cukup mencolok, di antaranya:

  • Membutuhkan pengawasan manusia secara terus-menerus.
  • Tergantung pada API yang sudah disediakan untuk setiap layanan.

Tidak semua layanan digital memiliki API terbuka. Bahkan, banyak proses online seperti pemesanan, pengisian formulir, atau interaksi dengan interface web tidak bisa dilakukan hanya dengan API. Nova Act hadir untuk mengatasi hal ini.

 

Fitur Utama Nova Act

Untuk menjawab kebutuhan agen AI yang lebih mandiri, Amazon memperkenalkan Nova Act bersama dengan Nova Act SDK (Software Development Kit) sebagai alat bantu utama bagi para pengembang.

  1. Automasi Tugas di Web Browser
    Dengan SDK ini, pengembang dapat membangun agen yang mampu:
    • Mengirim notifikasi cuti otomatis.
    • Menjadwalkan acara di kalender.
    • Mengaktifkan balasan otomatis pada email.
    • Mengisi formulir secara otomatis.
    • Melakukan transaksi online seperti checkout.
  2. Perintah Atomik (Atomic Commands)
    Amazon merancang sistem ini agar dapat memecah proses yang kompleks menjadi perintah kecil yang sederhana dan andal, seperti:
    • Klik pada elemen tertentu.
    • Menentukan nilai dari dropdown.
    • Menekan tombol submit.
    • Mengabaikan pop-up tertentu.
    Instruksi tambahan juga bisa diberikan untuk memperhalus proses ini. Misalnya, pengembang dapat mengatur agar agen mengabaikan penawaran asuransi tambahan saat checkout, sesuatu yang biasanya memerlukan intervensi manual.
  3. Integrasi Teknologi Canggih
    Nova Act SDK mendukung:
    • Manipulasi browser menggunakan Playwright.
    • Pemanggilan API secara langsung.
    • Integrasi dengan bahasa pemrograman Python.
    • Pemrosesan paralel (multithreading) untuk mengatasi waktu tunggu pada pemuatan halaman web.

 

Performa Luar Biasa dalam Pengujian

Nova Act dirancang dengan fokus utama pada keandalan dan ketepatan, bukan hanya pada generasi jawaban. Amazon mengklaim bahwa Nova Act berhasil mencapai:

  • Skor 0.939 dalam ScreenSpot Web Text Benchmark.
  • Skor 0.879 dalam ScreenSpot Web Icon Benchmark.

Kedua tes ini mengukur kemampuan AI dalam memahami dan menjalankan instruksi berbasis teks dan visual di web. Hasil ini mengungguli pesaing utama seperti:

  • Claude 3.7 Sonnet (0.900),
  • OpenAI CUA (0.883).

Meski dalam tes GroundUI Web Nova Act sedikit tertinggal, Amazon melihatnya sebagai peluang untuk peningkatan di masa depan.

 

Kemampuan Operasional yang Fleksibel

Setelah agen yang dibangun dengan Nova Act berhasil dijalankan, ia bisa dioperasikan dalam berbagai mode:

  • Headless: dijalankan di latar belakang tanpa tampilan grafis.
  • API: diintegrasikan sebagai layanan web.
  • Asynchronous Tasking: dijalankan secara otomatis sesuai jadwal.

Sebagai contoh, Nova Act bisa digunakan untuk memesan salad otomatis setiap hari Selasa malam. Sebuah contoh nyata automasi yang sepenuhnya tanpa campur tangan pengguna setelah konfigurasi awal.

 

Kemampuan Adaptasi Tinggi

Salah satu fitur paling menonjol dari Nova Act adalah kemampuannya beradaptasi dengan cepat terhadap lingkungan baru, meskipun tidak pernah dilatih secara eksplisit untuk lingkungan tersebut.

Amazon membuktikan bahwa Nova Act bisa bermain game berbasis web meskipun tidak pernah dilatih untuk bermain game sebelumnya. Ini menunjukkan tingkat pemahaman antarmuka pengguna (UI) yang sangat tinggi dan kemampuan adaptif yang luar biasa.

 

Integrasi dalam Ekosistem Amazon

Amazon juga sudah mulai menerapkan Nova Act ke dalam ekosistemnya, terutama dalam Alexa+. Dengan kemampuan baru ini, Alexa+ bisa:

  1. Menjelajahi web secara mandiri.
  2. Menyelesaikan tugas-tugas yang sebelumnya hanya mungkin dilakukan dengan API.
  3. Menjadi lebih cerdas dan fleksibel dalam membantu pengguna.

 

Visi Amazon untuk Masa Depan Agen AI

Amazon menekankan bahwa peluncuran Nova Act ini adalah langkah pertama dari proyek jangka panjang untuk membangun agen AI yang benar-benar pintar. Perusahaan ini berambisi menciptakan agen AI yang dapat:

  1. Menangani tugas-tugas bertahap yang kompleks.
  2. Belajar melalui reinforcement learning.
  3. Beradaptasi dengan berbagai skenario kehidupan nyata.

Amazon juga menggarisbawahi bahwa masih banyak kasus penggunaan yang belum ditemukan, dan mereka percaya pengembang dan desainer terbaik akan menemukan cara-cara baru yang revolusioner untuk menggunakan teknologi ini.

Dengan menyediakan SDK versi pratinjau riset, Amazon berharap bisa berkolaborasi langsung dengan komunitas pengembang untuk menyempurnakan Nova Act melalui proses umpan balik yang cepat dan terus-menerus.

Kesimpulan
Nova Act adalah lompatan besar dalam dunia AI. Dengan menggabungkan pemahaman antarmuka pengguna, automasi tugas kompleks, dan kemampuan adaptif tinggi, Amazon membuka jalan menuju agen AI yang:

  • Lebih cerdas,
  • Lebih mandiri,
  • Dan lebih berguna untuk dunia nyata.

Inovasi ini bukan hanya tentang kecanggihan teknologi, tetapi juga tentang bagaimana teknologi bisa membantu kita menyelesaikan pekerjaan secara lebih efisien, cepat, dan tanpa perlu terus-menerus dipantau.

Dari sekadar menjawab pertanyaan menjadi agen digital yang bisa bekerja layaknya asisten manusia, Nova Act adalah representasi dari masa depan AI yang semakin mendekati kenyataan.

Bagikan artikel ini

Komentar ()

Berlangganan

Berlangganan newsletter kami dan dapatkan informasi terbaru.

Video Terkait