Phi மாதிரிகளுக்கான AI பாதுகாப்பு
February 1, 2026 · View on GitHub
Phi குடும்ப மாதிரிகள் Microsoft Responsible AI Standard என்ற நிறுவ-wide தேவைகளின் அடிப்படையில் உருவாக்கப்பட்டவை, இது பின்வரும் ஆறு கொள்கைகளின் அடிப்படையில் அமைந்துள்ளது: பொறுப்பு, வெளிப்படைத்தன்மை, நியாயம், நம்பகத்தன்மை மற்றும் பாதுகாப்பு, தனியுரிமை மற்றும் பாதுகாப்பு மற்றும் உட்புகுத்தல் ஆகியவை Microsoft இன் பொறுப்பான AI கொள்கைகள் ஆகும்.
பழைய Phi மாதிரிகள் போல், பலதரப்பட்ட பாதுகாப்பு மதிப்பீடு மற்றும் பாதுகாப்பு பயிற்சி பின்பற்றப்பட்டது, மேலும் இந்த வெளியீட்டின் பல மொழித் திறன்களுக்கான கூடுதல் நடவடிக்கைகள் எடுக்கப்பட்டன. நமது பாதுகாப்பு பயிற்சி மற்றும் மதிப்பீடுகளுக்கான அணுகுமுறை, பல மொழிகள் மற்றும் ஆபத்து வகைகளைவிட்டு சோதிப்பது உட்பட, Phi Safety Post-Training Paper இல் விவரிக்கப்பட்டுள்ளது. Phi மாதிரிகள் இந்த அணுகுமுறையால் பலன் பெறினாலும், மேம்படுத்துனர்கள் தங்களுடைய தனிப்பட்ட பயன்பாட்டுக்கும் கலாச்சார மற்றும் மொழி சார்ந்த சூழ்நிலைக்கும் ஏற்ப பொறுப்பான AI சிறந்த நடைமுறைகளை பின்பற்ற வேண்டும்; இதில் ஆபத்துக்களை வரைபடம் செய்வது, அளவிடுவது மற்றும் குறைக்கும் பணிகள் அடங்கும்.
சிறந்த நடைமுறைகள்
மற்ற மாதிரிகளின் போல், Phi குடும்ப மாதிரிகள் தவறான, நம்பமுடியாத அல்லது அக்கறையற்ற முறையில் நடப்பதற்கான சாத்தியங்கள் உள்ளன.
SLM மற்றும் LLM இன் சில வரம்பிடப்பட்ட நடத்தைகள் நீங்கள் அறிந்து கொள்ள வேண்டியவை:
- சேவையின் தரம்: Phi மாதிரிகள் முதன்மையாக ஆங்கில உரையில் பயிற்சி பெற்றுள்ளன. ஆங்கிலம் அல்லாத மொழிகள் மோசமான செயல்திறன் காணும். பயிற்சி தரவுகளில் குறைவான பிரதிநிதித்துவம் கொண்ட ஆங்கில மொழிப் பகுதிகள் மைய அமெரிக்க ஆங்கிலத்தை விட மோசமான செயல்திறன் காணலாம்.
- பாதிப்புகளின் பிரதிநிதித்துவம் மற்றும் முன்னோக்கிய குற்றச்சாட்டுகள்: இந்த மாதிரிகள் மக்கள் குழுக்களில் அதிகப்பட்சம் அல்லது குறைந்தபட்சம் பிரதிநிதித்துவம் காட்டலாம், சில குழுக்களின் பிரதிநிதித்துவத்தை நீக்கலாம், அல்லது அவமானகர அல்லது எதிர்மறை குற்றச்சாட்டுக்களை வலியுறுத்தலாம். பாதுகாப்பு பயிற்சிக்குப் பிறகும், இந்த வரம்பிடல்கள் பல்வேறு குழுக்களின் பிரதிநிதித்துவத்தின் வேறுபாடு அல்லது பயிற்சி தரவுகளில் நிகழும் எதிர்மறை குற்றச்சாட்டின் உணவுப்பொருள் மற்றும் சமூக பாகுபாடுகளின் ஒளிப்படிப்பிற்கேற்ப இருக்கக்கூடும்.
- உகந்தவோ அசட்டையமான உள்ளடக்கம்: இந்த மாதிரிகள் மற்ற வகையான அசட்டையமான அல்லது அசட்டையான உள்ளடக்கத்தை உருவாக்கக்கூடும், இது நுண்ணறிவு நடவடிக்கைகள் இல்லாமல் நுட்பமான சூழலில் பயன்படுத்துவதற்கு சரியல்ல.
- தகவல் நம்பகத்தன்மை: மொழி மாதிரிகள் அர்த்தமற்ற உள்ளடக்கம் உருவாக்க அல்லது கூடுதலானதாய் கேள்வி எழுப்பும் மற்றும் தவறான அல்லது பழைய தகவல்களை உருவாக்கக்கூடும்.
- குறியீட்டுக்கான வரம்பு: Phi-3 பயிற்சி தரவின் பெரும்பகுதி Python அடிப்படையிலானது மற்றும் "typing, math, random, collections, datetime, itertools" போன்ற பொதுவான தொகுப்புகளைப் பயன்படுத்துகிறது. மாதிரி Python ஸ்கிரிப்ட்கள் உருவாக்கும் போது மற்ற தொகுப்புகள் அல்லது பிற மொழி ஸ்கிரிப்ட்களை பயன்படுத்தினால், அனைத்து API பயன்படுத்துதல்களையும் கைமுறை பரிசோதனை செய்யப்பட வேண்டும் என்று நாம் பரிந்துரைக்கிறோம்.
மேம்படுத்துனர்கள் பொறுப்பான AI சிறந்த நடைமுறைகளை பின்பற்ற வேண்டும் மற்றும் குறிப்பிட்ட பயன்பாடு தொடர்பான சட்டங்கள் மற்றும் விதிகளை (உதா: தனியுரிமை, வர்த்தகம், மற்றும் பிற) பின்பற்றுவதை உறுதிப்படுத்த வேண்டும்.
பொறுப்பான AI கருதுகோள்கள்
மற்ற மொழி மாதிரிகளின் போல், Phi தொடர்மாதிரிகள் தவறான, நம்பமுடியாத, அல்லது அக்கறையற்ற வகையில் நடப்பதற்கான வாய்ப்பு உள்ளன. குறிப்பாக கவனிக்க வேண்டிய சில வரம்பிடப்பட்ட நடத்தைகள்:
சேவையின் தரம்: Phi மாதிரிகள் முதன்மையாக ஆங்கில உரையில் பயிற்சி பெற்றுள்ளன. ஆங்கிலம் அல்லாந் மொழிகள் மோசமான செயல்திறன் காணும். பயிற்சி தரவுகளில் குறைவான பிரதிநிதித்துவம் கொண்ட ஆங்கில மொழி பகுதிகள் மைய அமெரிக்க ஆங்கிலத்தை விட மோசமான செயல்திறன் காணலாம்.
பாதிப்புகளின் பிரதிநிதித்துவம் மற்றும் முன்னோக்கிய குற்றச்சாட்டுகள்: இந்த மாதிரிகள் மக்கள் குழுக்களில் அதிகப்பட்சம் அல்லது குறைந்தபட்சம் பிரதிநிதித்துவம் காட்டலாம், சில குழுக்களின் பிரதிநிதித்துவத்தை நீக்கலாம், அல்லது அவமானகர அல்லது எதிர்மறை குற்றச்சாட்டுக்களை வலியுறுத்தலாம். பாதுகாப்பு பயிற்சிக்குப் பிறகும், இந்த வரம்பிடல்கள் பல்வேறு குழுக்களின் பிரதிநிதித்துவத்தின் வேறுபாடு அல்லது பயிற்சி தரவுகளில் நிகழும் எதிர்மறை குற்றச்சாட்டின் உணவுப்பொருள் மற்றும் சமூக பாகுபாடுகளின் ஒளிப்படிப்பிற்கேற்ப இருக்கக்கூடும்.
உகந்தவோ அசட்டையமான உள்ளடக்கம்: இந்த மாதிரிகள் மற்ற வகையான அசட்டையமான அல்லது அசட்டையான உள்ளடக்கத்தை உருவாக்கக்கூடும், இது நுண்ணறிவு நடவடிக்கைகள் இல்லாமல் நுட்பமான சூழலில் பயன்படுத்துவதற்கு சரியல்ல. தகவல் நம்பகத்தன்மை: மொழி மாதிரிகள் அர்த்தமற்ற உள்ளடக்கம் உருவாக்க அல்லது கூடுதலானதாய் கேள்வி எழுப்பும் மற்றும் தவறான அல்லது பழைய தகவல்களை உருவாக்கக்கூடும்.
குறியீட்டுக்கான வரம்பு: Phi-3 பயிற்சி தரவின் பெரும்பகுதி Python அடிப்படையிலானது மற்றும் "typing, math, random, collections, datetime, itertools" போன்ற பொதுவான தொகுப்புகளைப் பயன்படுத்துகிறது. மாதிரி Python ஸ்கிரிப்ட்கள் உருவாக்கும் போது மற்ற தொகுப்புகள் அல்லது பிற மொழி ஸ்கிரிப்ட்களை பயன்படுத்தினால், அனைத்து API பயன்படுத்துதல்களையும் கைமுறை பரிசோதனை செய்யப்பட வேண்டும் என்று நாம் பரிந்துரைக்கிறோம்.
மேம்படுத்துனர்கள் பொறுப்பான AI சிறந்த நடைமுறைகளை பின்பற்ற வேண்டும் மற்றும் குறிப்பிட்ட பயன்பாடு தொடர்பான சட்டங்கள் மற்றும் விதிகளை (உதா: தனியுரிமை, வர்த்தகம், மற்றும் பிற) பின்பற்றுவதை உறுதிப்படுத்த வேண்டும். கவனிக்க வேண்டிய முக்கிய பகுதிகள்:
ஒதுக்கீடு: மாதிரிகள் சட்டபூர்வ நிலை அல்லது வளங்கள் அல்லது வாழ்க்கை வாய்ப்புக்களின் ஒதுக்கீடுகளுக்கு (எ.கா.: வீடு, வேலை, கடன்) விளைவூட்டக்கூடிய சூழலுக்கு பொருத்தமாக இருக்கக்கூடாது; மேலும் மதிப்பீடுகள் மற்றும் கூடுதல் முன்பாகியல் தொழில்நுட்பங்கள் தேவை.
உயர் ஆபத்துடைய சூழல்கள்: தவறான, நம்பமுடியாத அல்லது அக்கறையற்ற விளைவுகள் மிகுந்த செலவில் அல்லது தீங்குகளை ஏற்படுத்தக்கூடிய உயர் ஆபத்துச் சூழல்களில் மாதிரிகளின் பொருத்தத்தைக் மதிப்பிட வேண்டும். இதில் துல்லியமும் நம்பகத்தன்மையும் மிகவும் அவசியமான நுண்ணறிவு அல்லது நிபுணத்து பரிந்துரைகள் (எ.கா.: சட்டம் அல்லது சுகாதார ஆலோசனை) அடங்கும். பயன்பாட்டு நிலைசார்ந்த கூடுதல் பாதுகாப்பு நடவடிக்கைகள் அமல்படுத்த வேண்டும்.
தவறான தகவல் பரவல்: மாதிரிகள் தவறான தகவலை உருவாக்கக்கூடும். மேம்படுத்துனர்கள் வெளிப்படைத்தன்மை சிறந்த நடைமுறைகளை பின்பற்றி இறுதி பயனாளர்களுக்கு அவர்கள் AI அமைப்போடு தொடர்பில் இருப்பதாக அறிவிக்க வேண்டும். பயன்பாட்டு நிலைசாரில், மேம்படுத்துனர்கள் கருத்தறிக்கை முறைகள் மற்றும் பைப்லைன்களை அமைத்துக் கொண்டு பதில்களை குறிப்பிட்ட பயன்பாட்டு, சூழ்நிலைப் பற்றிய தகவல்களுடன் தரவு மூலம் நிலையாக வைத்துக்கொள்ளலாம், இதை Retrieval Augmented Generation (RAG) என அழைக்கலாம்.
பாதிப்புகடைத்த உள்ளடக்கம் உருவாக்கல்: மேம்படுத்துனர்கள் விளைவுகளின் சூழலை மதிப்பிட்டு, பாதுகாப்பு வகைப்படுத்திகள் அல்லது குறிப்பிட்ட பயன்பாட்டிற்கு ஏற்ற தனிப்பயன் தீர்வுகளை பயன்படுத்த வேண்டும்.
தவறுதலைக் கண்டுகொள்வது: மோசடி, ஸ்பாம் அல்லது மென்பொருள் பக்கவாத உற்பத்தி போன்ற தவறுதல்கள் ஏற்படக்கூடும்; மேம்படுத்துனர்கள் தங்கள் பயன்பாடுகள் உரிய சட்டங்களுக்கும் விதிகளுக்கும் எதிராக இருக்காதிருப்பதை உறுதிசெய்ய வேண்டும்.
சூழலைத் திருத்தல் மற்றும் AI உள்ளடக்க பாதுகாப்பு
மாதிரியை சூழலைத் திருத்திய பிறகு, மாதிரிகள் உருவாக்கும் உள்ளடக்கத்தை கண்காணிக்க, அபாயங்கள், அச்சுறுத்தல்கள் மற்றும் தரக்குறைவுகளை கண்டறிய Azure AI Content Safety நடவடிக்கைகளை பயன்படுத்த பரிந்துரைக்கப்படுகிறது.

Azure AI Content Safety உரையும் படமும் உள்ளடக்கத்தையும் ஆதரிக்கிறது. இது கிளவுட், துண்டிக்கப்பட்ட கொண்டெயினர்கள், மற்றும் எட்ஜ்/இம்பெட்டெட் சாதனங்களில் பயன்படுத்தலாம்.
Azure AI Content Safety க்கான கண்ணோட்டம்
Azure AI Content Safety ஒரு ஒன்றுக்கு பொருத்தமான தீர்வு இல்லை; இது வணிக நிறுவனங்களின் தனிப்பட்ட கொள்கைகளுக்கு ஏற்ப தழுவிக்கொள்ளப்படலாம். கூடுதலாக, பல மொழி மாதிரிகள் ஒரே நேரத்தில் பல மொழிகளைப் புரிந்து கொள்கின்றன.
![]()
- Azure AI Content Safety
- Microsoft Developer
- 5 வீடியோக்கள்
Azure AI Content Safety சேவை பயன்பாடுகள் மற்றும் சேவைகளில் இடையூறும் பயனர் உருவாக்கிய மற்றும் AI உருவாக்கிய பாதிப்புடைய உள்ளடக்கத்தைக் கண்டறிகிறது. இதில் பாதிப்புடைய அல்லது அசட்டையமான பொருட்களை கண்டறியும் உரை மற்றும் பட API-கள் அடங்கும்.
முகவரிக்கை:
இந்த ஆவணம் AI மொழிமாற்ற சேவை Co-op Translator பயன்படுத்தி மொழிமாற்றம் செய்யப்பட்டிருக்கிறது. நாங்கள் துல்லியத்திற்காக முயற்சிக்கிறோம் என்பதாலும், தானாக yapıl்கின்ற மொழியாக்கங்களில் பிழைகள் அல்லது தவறுகள் இருக்கலாம் என்பதையும் தயவுசெய்து கவனத்தில் கொள்ளவும். அசல் ஆவணம் அதன் சொந்த மொழியில் அங்கீகாரத்துக்குரிய ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிமாற்றம் பரிந்துரைக்கப்படுகிறது. இந்த மொழிமாற்ற பயன்பாட்டின் காரணமாக ஏற்படும் எந்தவொரு தவறான புரிதல் அல்லது தவறான உரையாடல் ஆகியவற்றிற்கு நாங்கள் பொறுப்பேற்க மாட்டோம்.