การใช้ Microsoft Foundry ในการประเมิน
March 30, 2026 · View on GitHub

วิธีการประเมินแอปพลิเคชันปัญญาประดิษฐ์เชิงสร้างสรรค์ของคุณโดยใช้ Microsoft Foundry ไม่ว่าคุณจะกำลังประเมินการสนทนาแบบรอบเดียวหรือหลายรอบ Microsoft Foundry มีเครื่องมือสำหรับประเมินผลการทำงานและความปลอดภัยของโมเดล

วิธีการประเมินแอปปัญญาประดิษฐ์เชิงสร้างสรรค์ด้วย Microsoft Foundry
สำหรับคำแนะนำรายละเอียดเพิ่มเติม โปรดดูที่ Microsoft Foundry Documentation
นี่คือขั้นตอนเริ่มต้น:
การประเมินโมเดลปัญญาประดิษฐ์เชิงสร้างสรรค์ใน Microsoft Foundry
ข้อกำหนดเบื้องต้น
- ชุดข้อมูลทดสอบในรูปแบบ CSV หรือ JSON
- โมเดลปัญญาประดิษฐ์เชิงสร้างสรรค์ที่ถูกนำไปใช้งานแล้ว (เช่น Phi-3, GPT 3.5, GPT 4 หรือโมเดล Davinci)
- เวลารันไทม์พร้อมอินสแตนซ์คอมพิวต์สำหรับรันการประเมิน
ตัวชี้วัดการประเมินที่มีในตัว
Microsoft Foundry ช่วยให้คุณประเมินได้ทั้งการสนทนาแบบรอบเดียวและแบบซับซ้อนหลายรอบ
สำหรับสถานการณ์ Retrieval Augmented Generation (RAG) ที่โมเดลได้รับข้อมูลเฉพาะ คุณสามารถประเมินผลได้โดยใช้ตัวชี้วัดการประเมินที่มีในตัว
นอกจากนี้ คุณยังสามารถประเมินการตอบคำถามแบบรอบเดียวทั่วไป (non-RAG) ได้
การสร้างรันการประเมิน
จาก UI ของ Microsoft Foundry ให้ไปที่หน้าประเมิน (Evaluate) หรือหน้าระบบ Prompt Flow
ทำตามตัวช่วยสร้างการประเมินเพื่อสร้างรันการประเมิน กำหนดชื่อสำหรับการประเมินของคุณตามต้องการ
เลือกสถานการณ์ที่สอดคล้องกับวัตถุประสงค์ของแอปพลิเคชัน
เลือกตัวชี้วัดการประเมินหนึ่งตัวหรือมากกว่านั้นเพื่อวัดผลลัพธ์ของโมเดล
การปรับแต่งลำดับขั้นตอนการประเมิน (ทางเลือก)
เพื่อความยืดหยุ่นที่มากขึ้น คุณสามารถสร้างลำดับขั้นตอนการประเมินแบบกำหนดเอง ปรับแต่งกระบวนการประเมินตามความต้องการเฉพาะของคุณ
การดูผลลัพธ์
หลังจากรันการประเมินแล้ว ให้ลงชื่อเข้าใช้ ดู และวิเคราะห์ตัวชี้วัดการประเมินอย่างละเอียดใน Microsoft Foundry เพื่อรับข้อมูลเชิงลึกเกี่ยวกับความสามารถและข้อจำกัดของแอปพลิเคชันของคุณ
หมายเหตุ Microsoft Foundry ยังอยู่ในช่วงสาธิตสาธารณะ ดังนั้นให้ใช้สำหรับทดลองและพัฒนาผลงาน สำหรับงานในระบบจริง ให้พิจารณาตัวเลือกอื่น ๆ สำรวจเอกสาร AI Foundry อย่างเป็นทางการ สำหรับรายละเอียดและคำแนะนำทีละขั้นตอนเพิ่มเติม
ข้อจำกัดความรับผิดชอบ:
เอกสารนี้ได้รับการแปลโดยใช้บริการแปลภาษา AI Co-op Translator แม้ว่าเราจะพยายามให้มีความถูกต้อง โปรดทราบว่าการแปลแบบอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่ถูกต้อง เอกสารต้นฉบับในภาษาต้นทางถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่สำคัญ ควรใช้การแปลโดยมนุษย์มืออาชีพ เราไม่นรับผิดชอบต่อความเข้าใจผิดหรือการตีความผิดใด ๆ ที่เกิดขึ้นจากการใช้การแปลนี้