Popüler yapay zekâ GPT-4, lise testlerini ve hukuk fakültesi sınavlarını yüzde 90'lık dilimde yer alan puanlarla geçebiliyor ve önceki versiyonla mümkün olmayan birçok yeni işleme yeteneklerine sahip bir şekilde dün akşam saatlerinde kullanıcıları (Premium) ile buluştu.

GPT-4'ün test sonuçlarından elde edilen rakamlara bakıldığında, karşımızda "çok daha incelikli talimatları" daha yaratıcı ve güvenilir bir şekilde ele almanın yanı sıra görüntü, ses ve video girdilerini de metne dönüştürebilen bir yapay zekanın olduğu görülüyor. 

OpenAI, yaptığı sunuda "Simüle edilmiş bir baro sınavını, sınava girenlerin ilk yüzde 10'u civarında bir puanla geçiyor," diye oldukça etkileyici bir veriyi de kullanıcılarına sundu. 

Exam results of GPT-4 and GPT-3.5 on a range of recent U.S. exams. Source: OpenAI

GPT4'ün puanı, onu uluslararası sıralamada ilk 20'deki bir hukuk fakültesine kabul edilmek için iyi bir konuma getiriyor. Diğer taraftan Harvard, Stanford, Princeton veya Yale gibi prestijli okullara kabul için gerekli olduğu bildirilen puanlardan sadece birkaç puanı eksik.

GPT-4 ayrıca, yeni mezun hukuk öğrencilerinin girdiği ve ABD'nin herhangi bir yargı bölgesinde avukatlık yapmalarına izin veren bir sınav olan Uniform Bar Exam'da 400 üzerinden 298 puan almayı başardı.

UBE scores needed to be admitted to practice law in each U.S. jurisdiction. Source: National Conference of Bar Examiners

ChatGPT'nin eski versiyonunun bu testte zorlandığını ve 400 üzerinden 213 puanla son yüzde 10'da kaldığını belirtmekte fayda var.

Exam results of GPT-4 and GPT-3.5 on a range of recent U.S. exams. Source: OpenAI

Ancak AP Calculus puanı oldukça ortalamaydı ve 43. ila 59. yüzdelik dilimler arasında yer aldı.

GPT-4'ün eksik olduğu bir diğer alan da İngiliz edebiyatı sınavlarıydı ve iki ayrı testte 8 ila 44. yüzdelik dilimlerde puanlar yayınladı.

OpenAI, GPT-4 ve GPT-3.5'in bu testleri 2022-2023 deneme sınavlarından aldığını ve dil işleme araçları tarafından "özel bir eğitim" alınmadığını söyledi:

“We did no specific training for these exams. A minority of the problems in the exams were seen by the model during training, but we believe the results to be representative.”

İlginç bir şekilde FactoryDAO'nun kurucusu Nick Almond, 14 Mart'ta 14.300 Twitter takipçisine GPT4'ün "insanları korkutacağını" ve küresel eğitim sistemini "çökerteceğini" söyledi.

 

GPT-4 kripto dünyasında da ses getirdi

Eski Coinbase yöneticisi Conor Grogan, GPT-4'e canlı bir Ethereum akıllı sözleşmesi eklediğini ve sohbet botunun anında birkaç "güvenlik açığına" işaret ettiğini ve kodun nasıl istismar edilebileceğini özetlediğini söyledi:

ChatGPT üzerinde daha önce yapılan akıllı sözleşme denetimleri, ilk sürümünün kod hatalarını da makul ölçüde tespit edebildiğini ortaya koymuştu. Yapay zeka haber bülteni The Rundown'ın kurucusu Rowan Cheung, GPT'nin bir kağıt parçasına elle çizilmiş sahte bir web sitesini koda dönüştürdüğü bir video paylaştı.