5 Faktor yang Bikin DeepSeek Dinilai Lebih Unggul Ketimbang Model AI Lain

31 January 2025 | 13:35 WIB

Desyinta Nuraini Jurnalis Hypeabis.id

DeepSeek menyorot perhatian dunia setelah meluncurkan model artificial intelligence (AI) terbarunya, DeepSeek-R1. Produk kecerdasan buatan besutan startup teknologi China itu digadang-gadang menjadi pesaing berat ChatGPT dari OpenAI.

DeepSeek-R1, disebut memiliki kinerjanya yang kompetitif, sifatnya yang open-source, dan pengembangannya yang hemat biaya. Mengutip Gizmochina, model kecerdasan buatan ini menawarkan kinerja yang sebanding dengan ChatGPT tapi memiliki keunggulan dari sisi efisiensi dan pendekatan inovatif.

Baca juga: Fitur-fitur DeepSeek, AI China yang Jadi Saingan Berat ChatGPT

Kemunculan DeepSeek terbilang mengguncang pasar AI global. Peluncuran DeepSeek-R1 memicu aksi jual besar-besaran pada saham terkait AI. Misal, Nvidia yang kehilangan nilai pasar sebesar US$600 miliar karena, kekhawatiran bahwa model AI berbiaya rendah dapat mengurangi permintaan chip AI yang mahal.

Lantas apa yang membedakan DeepSeek dengan model AI lainnya? Simak ulasannya berikut ini yuk, Genhype.

1. Model open source

DeepSeek mengambil pendekatan yang berbeda dari raksasa teknologi kecerdasan buatan lainnya dengan memprioritaskan pengembangan open source atau sumber terbuka. Menurut Cloud Computing Indonesia, AI Open Source adalah jenis software kecerdasan buatan yang kode sumbernya tersedia untuk umum, sehingga siapa pun dapat melihat, mengubah, dan mendistribusikannya.

Nah, model DeepSeek-R1 memberikan kebebasan kepada peneliti, pengembang, dan bisnis untuk mengakses, memodifikasi, dan menerapkan teknologi tersebut. Pendekatan sumber terbuka ini memberikan transparansi yang lebih besar, mendorong peningkatan kolaboratif, dan menurunkan hambatan terhadap adopsi AI.

Alhasil, DeepSeek menjadi alternatif yang menarik bagi perusahaan dan pengembang independen yang lebih suka tidak terikat pada ekosistem milik sendiri.

2. Parameter & arsitektur model

DeepSeek-R1 menggunakan arsitektur Mixture-of-Experts (MoE), yang secara signifikan meningkatkan efisiensi komputasi. Model ini memiliki 671 miliar parameter, tetapi karena pengaturan MoE-nya, hanya 37 miliar parameter yang aktif pada waktu tertentu.

Dengan parameter tersebut, DeepSeek-R1 dapat mencapai kinerja tingkat tinggi sambil mempertahankan biaya komputasi yang lebih rendah daripada arsitektur berbasis transformator tradisional. Pendekatan DeepSeek memungkinkannya untuk mengoptimalkan sumber daya sambil mempertahankan akurasi dan efisiensi dalam tugas berbasis teks.

3. Efisiensi biaya & pemanfaatan sumber daya

DeepSeek mencapai kinerja AI yang setara dengan model-model terkemuka seperti GPT-4o milik OpenAI, Llama 3.1 milik Meta, dan Claude 3.5 Sonnet milik Anthropic, tetapi dengan biaya yang jauh lebih murah. Perusahaan mengeklaim telah melatih DeepSeek-R1 dengan anggaran sekitar US$5,6 juta, jauh lebih rendah daripada ratusan juta dolar yang dikeluarkan oleh para pesaingnya.

Efisiensi biaya ini sebagian besar disebabkan oleh penggunaan arsitektur MoE, yang mengoptimalkan komputasi dengan hanya mengaktifkan bagian model yang paling relevan selama setiap interaksi. DeepSeek dilaporkan melatih modelnya menggunakan GPU H800, versi yang sedikit diturunkan dari GPU H100 Nvidia yang berkinerja tinggi. Adapun versi ini dilarang diekspor ke China karena sanksi Amerika Serikat.

Harganya yang terjangkau juga menjadi keunggulan terbesar dari model AI lainnya. DeepSeek-R1 menawarkan akses API dengan harga U$0,14 atau setara Rp2.282 per juta token. Jika dibandingkan GPT-4o milik OpenAI, model ini mengenakan biaya U$7,50 atau setara Rp122.253 per juta token.

Strategi harga yang hemat biaya ini menjadikan DeepSeek sebagai opsi menarik bagi pengembang dan bisnis yang mencari model AI berkinerja tinggi tanpa biaya operasional yang mahal.

4. Penalaran & pengkodean

Model AI terbaru DeepSeek unggul dalam tugas-tugas teknis seperti penalaran, pengkodean, dan matematika. Dalam tolok ukur pihak ketiga, DeepSeek-R1 mengungguli GPT-4o dan model AI terkemuka lainnya dalam pemecahan masalah logis, perhitungan matematika, dan pembuatan kode.

Menurut laporan, model ini memperoleh skor 2.029 Elo di Codeforces, sebuah platform kompetisi pengodean, melampaui 96,3 persen peserta manusia. Model ini memadukan penalaran berantai (CoT), yang memungkinkannya memecah masalah kompleks menjadi solusi langkah demi langkah, area utama yang juga menjadi fokus model o1 OpenAI.

5. Bahasa

Berbeda dengan model AI lainnya yang fokus berbahasa Inggris, DeepSeek dirancang secara dwibahasa. Model AI ini unggul dalam tugas berbahasa Inggris dan Mandarin.

Kendati demikian, DeepSeek memang menunjukkan kecenderungan mencampur bahasa, terkadang menghasilkan respons yang mencampur bahasa Inggris dan Mandarin bahkan ketika perintah diberikan dalam bahasa yang berbeda. Kondisi ini menjadi batasan yang terus disempurnakan oleh perusahaan.

Baca juga: Kaspersky Wanti-wanti Model AI DeepSeek Rawan Serangan Siber

(Baca artikel Hypeabis.id lainnya di Google News)

Editor: Syaiful Millah