Google akhirnya mengumumkan model AI terbarunya yang dinamai Gemini (Sumber gambar: Google)

Lebih Dekat dengan Gemini, Model AI Baru Google Pesaing Berat GPT-4 

08 December 2023   |   08:21 WIB
Image
Syaiful Millah Asisten Manajer Konten Hypeabis.id

Google akhirnya resmi mengumumkan ke publik model bahasa besar (large language model/LLM) terbarunya yang dinamai Gemini. Model kecerdasan buatan itu pertama kali diungkap oleh bos besar Google dan Alphabet Sundar Pichai pada konferensi pengembang I/O Juni 2023. 

Dalam presentasinya, Pichai menegaskan kehadiran Gemini menjadi awal dari era baru artificial intelligence (AI) di Google. Menurutnya, Gemini merupakan model yang paling mumpuni dan umum serta berkinerja canggih di banyak tolok ukur. 

“Salah satu hal hebat mengenai momen ini adalah kalian dapat mengerjakan satu teknologi dasar dan menjadikannya lebih baik, dan teknologi tersebut langsung diterapkan ke seluruh produk kami,” katanya. 

Baca juga: Mengenal SynthID, Teknologi Google untuk Mengidentifikasi Gambar Hasil AI 

CEO & Founder Google DeepMind, Demis Hassabis, menambahkan bahwa Gemini merupakan hasil upaya kolaboratif skala besar yang dilakukan perusahaan. Teknologi tersebut dibangun dari awal menjadi multimodal, yang berarti bisa beroperasi di berbagai platform dan menggabungkan ragam jenis informasi; teks, kode, audio, gambar, dan video.

“Gemini juga merupakan model kami yang paling fleksibel, mampu menjalankan segala hal secara efisien mulai dari pusat data hingga perangkat seluler,” katanya dalam keterangan resmi

Google memperkenalkan Gemini versi 1.0 dalam tiga ukuran berbeda, yang masing-masing punya kegunaan tertentu. Gemini Ultra menjadi model tercanggih yang mampu mengerjakan tugas sangat kompleks, Gemini Pro untuk menskalakan berbagai tugas, dan Gemini Nano yang paling efisien. 

Terkait implementasi dan ketersediannya, Gemini Ultra yang merupakan LLM terkuat dirancang untuk pusat data dan aplikasi perusahaan. Gemini Pro akan dipakai untuk menjadi daya bagi layanan AI Bard, serta bisa dipakai melalui Google Generative AI Studio atau Vortex AI di Google Cloud untuk pengembang dan perusahaan. Sementara itu, Gemini Nano akan diintegrasikan ke dalam smartphone Google Pixel 8 Pro. 
 

Gemini Ultra, Pro, dan Nano (Sumber gambar: Google)

Gemini Ultra, Pro, dan Nano (Sumber gambar: Google)

Bicara soal keandalannya, Google mengeklaim bahwa kinerja model AI terbarunya itu lebih canggih ketimbang pesaing utamanya seperti GPT-4 baik dari kemampuan pemahaman gambar alami, audio dan video, sampai penalaran otomatis. Disebutkan bahwa kinerja Gemini Ultra lebih baik pada 30 dari 32 tolok ukur akademik yang dipakai dalam penelitian dan pengembangan LLM. 

Gemini Ultra bahkan mengungguli pakar manusia dalam massive multitask language understanding (MMLU), yang menggunakan kombinasi 57 mata pelajaran seperti matematika, fisika, sejarah, hukum, kedokteran, dan etika dalam pengujian pengetahuan dan kemampuan memecahkan masalah. Skornya mencapai 90%. 

“Pendekatan benchmark baru kami terhadap MMLU memungkinkan Gemini memakai kemampuan penalarannya untuk berpikir lebih hati-hati sebelum menjawab pertanyaan sulit, sehingga menghasilkan peningkatan signifikan dibandingkan hanya menggunakan kesan pertamanya,” demikian pernyataan tertulis di blog resminya. 
 

Kemampuan Gemini 

Dengan klaim benchmark yang demikian, seperti apa kemampuan Gemini dalam menjalankan tugasnya yang lebih aplikatif terhadap pengguna? Google menyatakan bahwa Gemini dirancang untuk menjadi multmodal asli, sehingga sejak awal dilatih untuk berbagai kemampuan, lalu menyempurnakannya dengan data tambahan agar lebih efektif. 

Berikut beberapa hal yang disebut perusahaan sebagai kemampuan next-gen yang ada di LLM Gemini. 
 

1. Ekstrak informasi literatur ilmiah 

Kemampuan penalaran multimodal Gemini 1.0 dapat membantu memahami informasi tertulis dan visual yang kompleks. Hal ini menjadikannya sebagai ‘seorang ahli’ dalam mengungkap pengetahuan yang lebih sulit di tengah banyaknya data yang tersedia.

Gemini diklaim mampu mengekstrak wawasan dari ratusan ribu dokumen dengan proses membaca, menyaring, dan memahami informasi yang cepat. Tak terkecuali dari hasil penelitian atau literatur ilmiah sampai laporan keuangan
 

2. Pemahaman teks, gambar, dan audio tingkat lanjut 

LLM Gemini dilatih untuk mengenali dan memahami ragam media termasuk teks, gambar, audio, dan lainnya secara bersamaan. Dengan begitu, model AI ini dapat memahami berbagai informasi dan menjawab pertanyaan topik yang rumit, termasuk penalaran mata pelajaran matematika dan fisika. 

Dalam video tes yang diunggah Google, Gemini dapat mengenali kesalahan penalaran matematika, menjelaskan apa yang salah, serta memberitahu proses dan hasil yang tepat dalam input prompt berbentuk gambar. 
 

3. Pengkodean yang lebih maju 

Gemini versi perdana bisa memahami, menjelaskan, dan menghasilkan kode rumit dalam bahasa pemrograman paling populer di dunia seperti Python, Java, C++, dan Go. Kemampuannya bekerja lintas bahasa dan mempertimbangkan informasi kompleks disebut-sebut akan menjadikan model ini sebagai salah satu yang paling maju di dunia. 

Gemini yang lebih khusus juga akan dipakai di AlphaCode 2, sistem pembuatan kode AI milik Google, untuk menciptakan sistem yang lebih canggih lagi. Pengujian internal menunjukkan peningkatan hampir 50% ketimbang versi terdahulunya AlphaCode yang tidak ditenagai oleh LLM terbaru Gemini. 
 

4. Terukur dan efisien 

Google melatih Gemini 1.0 dalam skala besar pada infrastruktur yang disebut Tensor Processing Unit (TPU) v4 dan vSe yang andal, terukur, dan efisien. Dengan teknologi itu, model AI terbaru mereka berjalan lebih cepat dengan ukurannya yang lebih kecil. 

Akselerator yang dirancang sendiri oleh Google itu telah menjadi inti dari produk perusahaan yang didukung AI mulai dari penelusuran, YouTube, Gmail, Google Maps, sampai Android. Hal ini juga memungkinkan pengembang untuk melatih model AI skala besar dengan biaya yang lebih efisien. 
 

5. Bertanggung jawab dan fokus keselamatan 

Tidak bisa dimungkiri, pengembangan model kecerdasan buatan telah menimbulkan banyak kekhawatiran soal misinformasi, bias, sampai keamanan para penggunanya. Untuk itu, Google menyatakan bahwa mereka mengembangkan AI yang bertanggung jawab berdasarkan Google AI Principles

Dalam mengembangkan Gemini, perusahaan telah melakukan penelitian baru terhadap area risiko potensial yang mungkin muncul. Misalnya terkait pelanggaran dunia maya, persuasi, otonomi, dan menerapkan teknik pengujian adversarial untuk membantu identifikasi masalah keamanan krusial. 

Google juga membuat klasifikasi keamanan khusus untuk mengidentifikasi, memberi label, dan memilah konten yang melibatkan kekerasan atau stereotipe negatif. Mereka juga bekerja sama dengan organisasi seperti MLCommons dan pemenuhan tolok ukur Frontier Model Forum and AI Safety Funds, yang dirancang untuk memitigasi risiko keamanan terkait sistem AI. 

Baca juga: Daftar Istilah Artificial Intelligence yang Sering Disebut, AGI sampai LLM 
 

(Baca artikel Hypeabis.id lainnya di Google News)

Editor: Syaiful Millah

SEBELUMNYA

Daftar Pemain Drakor Soundtrack #2, Ada Geum Sae-rok & Noh Sang-hyun

BERIKUTNYA

Serial Populer The Boys Kembali dengan Season 4, Rencana Tayang 2024

Komentar


Silahkan Login terlebih dahulu untuk meninggalkan komentar.

Baca Juga: