Phi மாதிரிகளுக்கான AI பாதுகாப்பு

February 1, 2026 · View on GitHub

Phi குடும்ப மாதிரிகள் Microsoft Responsible AI Standard என்ற நிறுவ-wide தேவைகளின் அடிப்படையில் உருவாக்கப்பட்டவை, இது பின்வரும் ஆறு கொள்கைகளின் அடிப்படையில் அமைந்துள்ளது: பொறுப்பு, வெளிப்படைத்தன்மை, நியாயம், நம்பகத்தன்மை மற்றும் பாதுகாப்பு, தனியுரிமை மற்றும் பாதுகாப்பு மற்றும் உட்புகுத்தல் ஆகியவை Microsoft இன் பொறுப்பான AI கொள்கைகள் ஆகும்.

பழைய Phi மாதிரிகள் போல், பலதரப்பட்ட பாதுகாப்பு மதிப்பீடு மற்றும் பாதுகாப்பு பயிற்சி பின்பற்றப்பட்டது, மேலும் இந்த வெளியீட்டின் பல மொழித் திறன்களுக்கான கூடுதல் நடவடிக்கைகள் எடுக்கப்பட்டன. நமது பாதுகாப்பு பயிற்சி மற்றும் மதிப்பீடுகளுக்கான அணுகுமுறை, பல மொழிகள் மற்றும் ஆபத்து வகைகளைவிட்டு சோதிப்பது உட்பட, Phi Safety Post-Training Paper இல் விவரிக்கப்பட்டுள்ளது. Phi மாதிரிகள் இந்த அணுகுமுறையால் பலன் பெறினாலும், மேம்படுத்துனர்கள் தங்களுடைய தனிப்பட்ட பயன்பாட்டுக்கும் கலாச்சார மற்றும் மொழி சார்ந்த சூழ்நிலைக்கும் ஏற்ப பொறுப்பான AI சிறந்த நடைமுறைகளை பின்பற்ற வேண்டும்; இதில் ஆபத்துக்களை வரைபடம் செய்வது, அளவிடுவது மற்றும் குறைக்கும் பணிகள் அடங்கும்.

சிறந்த நடைமுறைகள்

மற்ற மாதிரிகளின் போல், Phi குடும்ப மாதிரிகள் தவறான, நம்பமுடியாத அல்லது அக்கறையற்ற முறையில் நடப்பதற்கான சாத்தியங்கள் உள்ளன.

SLM மற்றும் LLM இன் சில வரம்பிடப்பட்ட நடத்தைகள் நீங்கள் அறிந்து கொள்ள வேண்டியவை:

சேவையின் தரம்: Phi மாதிரிகள் முதன்மையாக ஆங்கில உரையில் பயிற்சி பெற்றுள்ளன. ஆங்கிலம் அல்லாத மொழிகள் மோசமான செயல்திறன் காணும். பயிற்சி தரவுகளில் குறைவான பிரதிநிதித்துவம் கொண்ட ஆங்கில மொழிப் பகுதிகள் மைய அமெரிக்க ஆங்கிலத்தை விட மோசமான செயல்திறன் காணலாம்.
பாதிப்புகளின் பிரதிநிதித்துவம் மற்றும் முன்னோக்கிய குற்றச்சாட்டுகள்: இந்த மாதிரிகள் மக்கள் குழுக்களில் அதிகப்பட்சம் அல்லது குறைந்தபட்சம் பிரதிநிதித்துவம் காட்டலாம், சில குழுக்களின் பிரதிநிதித்துவத்தை நீக்கலாம், அல்லது அவமானகர அல்லது எதிர்மறை குற்றச்சாட்டுக்களை வலியுறுத்தலாம். பாதுகாப்பு பயிற்சிக்குப் பிறகும், இந்த வரம்பிடல்கள் பல்வேறு குழுக்களின் பிரதிநிதித்துவத்தின் வேறுபாடு அல்லது பயிற்சி தரவுகளில் நிகழும் எதிர்மறை குற்றச்சாட்டின் உணவுப்பொருள் மற்றும் சமூக பாகுபாடுகளின் ஒளிப்படிப்பிற்கேற்ப இருக்கக்கூடும்.
உகந்தவோ அசட்டையமான உள்ளடக்கம்: இந்த மாதிரிகள் மற்ற வகையான அசட்டையமான அல்லது அசட்டையான உள்ளடக்கத்தை உருவாக்கக்கூடும், இது நுண்ணறிவு நடவடிக்கைகள் இல்லாமல் நுட்பமான சூழலில் பயன்படுத்துவதற்கு சரியல்ல.
தகவல் நம்பகத்தன்மை: மொழி மாதிரிகள் அர்த்தமற்ற உள்ளடக்கம் உருவாக்க அல்லது கூடுதலானதாய் கேள்வி எழுப்பும் மற்றும் தவறான அல்லது பழைய தகவல்களை உருவாக்கக்கூடும்.
குறியீட்டுக்கான வரம்பு: Phi-3 பயிற்சி தரவின் பெரும்பகுதி Python அடிப்படையிலானது மற்றும் "typing, math, random, collections, datetime, itertools" போன்ற பொதுவான தொகுப்புகளைப் பயன்படுத்துகிறது. மாதிரி Python ஸ்கிரிப்ட்கள் உருவாக்கும் போது மற்ற தொகுப்புகள் அல்லது பிற மொழி ஸ்கிரிப்ட்களை பயன்படுத்தினால், அனைத்து API பயன்படுத்துதல்களையும் கைமுறை பரிசோதனை செய்யப்பட வேண்டும் என்று நாம் பரிந்துரைக்கிறோம்.

மேம்படுத்துனர்கள் பொறுப்பான AI சிறந்த நடைமுறைகளை பின்பற்ற வேண்டும் மற்றும் குறிப்பிட்ட பயன்பாடு தொடர்பான சட்டங்கள் மற்றும் விதிகளை (உதா: தனியுரிமை, வர்த்தகம், மற்றும் பிற) பின்பற்றுவதை உறுதிப்படுத்த வேண்டும்.

பொறுப்பான AI கருதுகோள்கள்

மற்ற மொழி மாதிரிகளின் போல், Phi தொடர்மாதிரிகள் தவறான, நம்பமுடியாத, அல்லது அக்கறையற்ற வகையில் நடப்பதற்கான வாய்ப்பு உள்ளன. குறிப்பாக கவனிக்க வேண்டிய சில வரம்பிடப்பட்ட நடத்தைகள்:

சேவையின் தரம்: Phi மாதிரிகள் முதன்மையாக ஆங்கில உரையில் பயிற்சி பெற்றுள்ளன. ஆங்கிலம் அல்லாந் மொழிகள் மோசமான செயல்திறன் காணும். பயிற்சி தரவுகளில் குறைவான பிரதிநிதித்துவம் கொண்ட ஆங்கில மொழி பகுதிகள் மைய அமெரிக்க ஆங்கிலத்தை விட மோசமான செயல்திறன் காணலாம்.

பாதிப்புகளின் பிரதிநிதித்துவம் மற்றும் முன்னோக்கிய குற்றச்சாட்டுகள்: இந்த மாதிரிகள் மக்கள் குழுக்களில் அதிகப்பட்சம் அல்லது குறைந்தபட்சம் பிரதிநிதித்துவம் காட்டலாம், சில குழுக்களின் பிரதிநிதித்துவத்தை நீக்கலாம், அல்லது அவமானகர அல்லது எதிர்மறை குற்றச்சாட்டுக்களை வலியுறுத்தலாம். பாதுகாப்பு பயிற்சிக்குப் பிறகும், இந்த வரம்பிடல்கள் பல்வேறு குழுக்களின் பிரதிநிதித்துவத்தின் வேறுபாடு அல்லது பயிற்சி தரவுகளில் நிகழும் எதிர்மறை குற்றச்சாட்டின் உணவுப்பொருள் மற்றும் சமூக பாகுபாடுகளின் ஒளிப்படிப்பிற்கேற்ப இருக்கக்கூடும்.

உகந்தவோ அசட்டையமான உள்ளடக்கம்: இந்த மாதிரிகள் மற்ற வகையான அசட்டையமான அல்லது அசட்டையான உள்ளடக்கத்தை உருவாக்கக்கூடும், இது நுண்ணறிவு நடவடிக்கைகள் இல்லாமல் நுட்பமான சூழலில் பயன்படுத்துவதற்கு சரியல்ல. தகவல் நம்பகத்தன்மை: மொழி மாதிரிகள் அர்த்தமற்ற உள்ளடக்கம் உருவாக்க அல்லது கூடுதலானதாய் கேள்வி எழுப்பும் மற்றும் தவறான அல்லது பழைய தகவல்களை உருவாக்கக்கூடும்.

குறியீட்டுக்கான வரம்பு: Phi-3 பயிற்சி தரவின் பெரும்பகுதி Python அடிப்படையிலானது மற்றும் "typing, math, random, collections, datetime, itertools" போன்ற பொதுவான தொகுப்புகளைப் பயன்படுத்துகிறது. மாதிரி Python ஸ்கிரிப்ட்கள் உருவாக்கும் போது மற்ற தொகுப்புகள் அல்லது பிற மொழி ஸ்கிரிப்ட்களை பயன்படுத்தினால், அனைத்து API பயன்படுத்துதல்களையும் கைமுறை பரிசோதனை செய்யப்பட வேண்டும் என்று நாம் பரிந்துரைக்கிறோம்.

ஒதுக்கீடு: மாதிரிகள் சட்டபூர்வ நிலை அல்லது வளங்கள் அல்லது வாழ்க்கை வாய்ப்புக்களின் ஒதுக்கீடுகளுக்கு (எ.கா.: வீடு, வேலை, கடன்) விளைவூட்டக்கூடிய சூழலுக்கு பொருத்தமாக இருக்கக்கூடாது; மேலும் மதிப்பீடுகள் மற்றும் கூடுதல் முன்பாகியல் தொழில்நுட்பங்கள் தேவை.

உயர் ஆபத்துடைய சூழல்கள்: தவறான, நம்பமுடியாத அல்லது அக்கறையற்ற விளைவுகள் மிகுந்த செலவில் அல்லது தீங்குகளை ஏற்படுத்தக்கூடிய உயர் ஆபத்துச் சூழல்களில் மாதிரிகளின் பொருத்தத்தைக் மதிப்பிட வேண்டும். இதில் துல்லியமும் நம்பகத்தன்மையும் மிகவும் அவசியமான நுண்ணறிவு அல்லது நிபுணத்து பரிந்துரைகள் (எ.கா.: சட்டம் அல்லது சுகாதார ஆலோசனை) அடங்கும். பயன்பாட்டு நிலைசார்ந்த கூடுதல் பாதுகாப்பு நடவடிக்கைகள் அமல்படுத்த வேண்டும்.

தவறான தகவல் பரவல்: மாதிரிகள் தவறான தகவலை உருவாக்கக்கூடும். மேம்படுத்துனர்கள் வெளிப்படைத்தன்மை சிறந்த நடைமுறைகளை பின்பற்றி இறுதி பயனாளர்களுக்கு அவர்கள் AI அமைப்போடு தொடர்பில் இருப்பதாக அறிவிக்க வேண்டும். பயன்பாட்டு நிலைசாரில், மேம்படுத்துனர்கள் கருத்தறிக்கை முறைகள் மற்றும் பைப்லைன்களை அமைத்துக் கொண்டு பதில்களை குறிப்பிட்ட பயன்பாட்டு, சூழ்நிலைப் பற்றிய தகவல்களுடன் தரவு மூலம் நிலையாக வைத்துக்கொள்ளலாம், இதை Retrieval Augmented Generation (RAG) என அழைக்கலாம்.

பாதிப்புகடைத்த உள்ளடக்கம் உருவாக்கல்: மேம்படுத்துனர்கள் விளைவுகளின் சூழலை மதிப்பிட்டு, பாதுகாப்பு வகைப்படுத்திகள் அல்லது குறிப்பிட்ட பயன்பாட்டிற்கு ஏற்ற தனிப்பயன் தீர்வுகளை பயன்படுத்த வேண்டும்.

தவறுதலைக் கண்டுகொள்வது: மோசடி, ஸ்பாம் அல்லது மென்பொருள் பக்கவாத உற்பத்தி போன்ற தவறுதல்கள் ஏற்படக்கூடும்; மேம்படுத்துனர்கள் தங்கள் பயன்பாடுகள் உரிய சட்டங்களுக்கும் விதிகளுக்கும் எதிராக இருக்காதிருப்பதை உறுதிசெய்ய வேண்டும்.

சூழலைத் திருத்தல் மற்றும் AI உள்ளடக்க பாதுகாப்பு

மாதிரியை சூழலைத் திருத்திய பிறகு, மாதிரிகள் உருவாக்கும் உள்ளடக்கத்தை கண்காணிக்க, அபாயங்கள், அச்சுறுத்தல்கள் மற்றும் தரக்குறைவுகளை கண்டறிய Azure AI Content Safety நடவடிக்கைகளை பயன்படுத்த பரிந்துரைக்கப்படுகிறது.

Phi3AISafety

Azure AI Content Safety உரையும் படமும் உள்ளடக்கத்தையும் ஆதரிக்கிறது. இது கிளவுட், துண்டிக்கப்பட்ட கொண்டெயினர்கள், மற்றும் எட்ஜ்/இம்பெட்டெட் சாதனங்களில் பயன்படுத்தலாம்.

Azure AI Content Safety க்கான கண்ணோட்டம்

Azure AI Content Safety ஒரு ஒன்றுக்கு பொருத்தமான தீர்வு இல்லை; இது வணிக நிறுவனங்களின் தனிப்பட்ட கொள்கைகளுக்கு ஏற்ப தழுவிக்கொள்ளப்படலாம். கூடுதலாக, பல மொழி மாதிரிகள் ஒரே நேரத்தில் பல மொழிகளைப் புரிந்து கொள்கின்றன.

AIContentSafety

Azure AI Content Safety
Microsoft Developer
5 வீடியோக்கள்

Azure AI Content Safety சேவை பயன்பாடுகள் மற்றும் சேவைகளில் இடையூறும் பயனர் உருவாக்கிய மற்றும் AI உருவாக்கிய பாதிப்புடைய உள்ளடக்கத்தைக் கண்டறிகிறது. இதில் பாதிப்புடைய அல்லது அசட்டையமான பொருட்களை கண்டறியும் உரை மற்றும் பட API-கள் அடங்கும்.

AI Content Safety Playlist

முகவரிக்கை:
இந்த ஆவணம் AI மொழிமாற்ற சேவை Co-op Translator பயன்படுத்தி மொழிமாற்றம் செய்யப்பட்டிருக்கிறது. நாங்கள் துல்லியத்திற்காக முயற்சிக்கிறோம் என்பதாலும், தானாக yapıl்கின்ற மொழியாக்கங்களில் பிழைகள் அல்லது தவறுகள் இருக்கலாம் என்பதையும் தயவுசெய்து கவனத்தில் கொள்ளவும். அசல் ஆவணம் அதன் சொந்த மொழியில் அங்கீகாரத்துக்குரிய ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிமாற்றம் பரிந்துரைக்கப்படுகிறது. இந்த மொழிமாற்ற பயன்பாட்டின் காரணமாக ஏற்படும் எந்தவொரு தவறான புரிதல் அல்லது தவறான உரையாடல் ஆகியவற்றிற்கு நாங்கள் பொறுப்பேற்க மாட்டோம்.