Hugging Face dataset yükleme adımları ile makine öğrenimi verilerinizi paylaşmak ve Llama 3.2 gibi güncel modelleri kolayca fine-tune etmek artık çok daha erişilebilir. Aşağıda, Python talimat-çıktı veri setinizi Llama 3.2 formatına dönüştürüp Hugging Face Hub’a yüklemenin pratik yolunu bulabilirsiniz.
Hugging Face dataset yükleme adımları: Kurulum ve kimlik doğrulama
İlk olarak, gerekli paketleri kurup Hugging Face Hub’a giriş yapın:
- pip ile datasets kütüphanesini indirin
- huggingface-cli login komutuyla erişim tokeninizi girin

Hugging Face dataset yükleme adımları: Veri yükleme ve dönüşüm fonksiyonu oluşturma
- Verinizi yükleyin: load_dataset(‘Vezora/Tested-143k-Python-Alpaca’) gibi bir komutla örnek veri setinizi alın.
- Dönüşüm fonksiyonu: Her örneği Llama 3.2 chat formatında ve sistem prompt’uyla yapılandıracak bir fonksiyon yazın. Örneğin; kod, açıklama ve kullanıcı mesajlarını özel token yapısıyla bir araya getirin.
“System, user ve assistant etiketlerini Llama 3.2’nin özel tokenları ile kullanmak model eğitimi için kritik.”
Hugging Face dataset yükleme adımları: Veri dönüşümü ve yükleme
- map ile dönüştürme: Veri setinin tamamına dönüşüm fonksiyonunu uygulayın.
- push_to_hub ile paylaşım: transformed_dataset.push_to_hub(‘Llama-3.2-Python-Alpaca-143k’) komutu ile dataset’inizi profilinizde yayınlayın.
| Adım | Açıklama |
|---|---|
| Kurulum | datasets kurulumu ve Hugging Face token ile giriş |
| Dönüşüm | Kendi fonksiyonun ile Llama 3.2 chat formatı |
| Uygulama | map ile toplu dönüşüm |
| Yükleme | push_to_hub ile herkese açık paylaşım |
Hugging Face dataset yükleme adımları: İnce ayar ve topluluk paylaşımı
Dataset’iniz yüklendikten sonra Hugging Face Hub üzerinde, açıklama ve topluluk özellikleriyle ince ayar yapabilir, başkalarının da katkı sunmasını teşvik edebilirsiniz. Llama 3.2 formatı sayesinde, veri setiniz güncel dil modelleriyle doğrudan fine-tune edilebilir.



Comments are closed