• bugün (118)
  1. ikisi de büyük dil modeli, ikisinin de hallucination oranı var. hangisinin agi'ye daha yakın olduğundan bahsetmek şu an için erken, önce bir tutarlılık testi geçsinler. (bkz: benchmark fetişizmi)
  2. veri setleri temizlik ve etiketleme farkı dışında aynı gürültüyü üretiyor, hangisini tercih ederseniz edin sonuçta birine short atmadıkça kazancınız yok.