AI உரை கண்டறிவான்கள் ஒரு உரை AI-ஆல் எழுதப்பட்டதா என்று கணிக்க முயல்கின்றன — ஆனால் அவை நம்பகமற்றவை, குறிப்பாக தாய்மொழி-அல்லாத ஆங்கில/தமிழ் எழுத்தை தவறாக குறிக்கின்றன.

எப்படி வேலை செய்கின்றன?

கண்டறிவான்கள் உரையின் «கணிக்கக்கூடிய தன்மை» (perplexity) போன்ற புள்ளிவிவரங்களை பார்க்கின்றன — AI உரை பெரும்பாலும் மிக மென்மையான, கணிக்கக்கூடியதாக இருக்கும் என்ற அனுமானத்தில். ஆனால் இது நம்பகமற்ற அளவுகோல்.

ஏன் நம்பகமற்றவை?

ஒரு ஆராய்ச்சியில் (Liang et al. 2023, Patterns இதழ்), தாய்மொழி-அல்லாத ஆங்கில எழுத்தாளர்களுக்கு சராசரி 61.3% தவறான-நேர்மறை கண்டறியப்பட்டது — எளிய, கணிக்கக்கூடிய எழுத்து «AI» என தவறாக குறிக்கப்பட்டது. OpenAI-உம் தனது கண்டறிவானை 2023-இல் மூடியது.

தமிழ் தாக்கம்

தமிழ் போன்ற குறைந்த-வள மொழிகளுக்கும், தமிழ்-ஆங்கில இருமொழி எழுத்துக்கும் இந்த பக்கச்சார்பு இன்னும் மோசம். AI கண்டறிவான் முடிவை எந்த மாணவர்/எழுத்தாளரையும் குற்றம் சாட்ட ஆதாரமாக கருதாதீர்கள்.

சாட், ஆட்டோமேஷன், டிரான்ஸ்கிரிப்ஷன், படம் — ஒவ்வொன்றுக்கும் தனித்தனி சந்தா கட்டுகிறீர்களா? எல்லாவற்றையும் ஒரே இடத்தில் கொண்டுவருவதும் ஒரு வழி: osFoundry போன்ற ஏஜெண்ட் சார்ந்த (agentic) AI தளம் சாட், ஏஜெண்ட், நிறுவன ஆப்களை ஒன்றிணைத்து உங்கள் சொந்த விசையை (BYOK) கொண்டுவர அனுமதிக்கிறது — எந்த மாதிரி இயங்கும் என்பதை நீங்களே தீர்மானிக்கிறீர்கள்.

AI உரை கண்டறிவான்கள் நம்பகமற்றவை: ஆராய்ச்சியில் (Liang et al. 2023, Patterns இதழ்) தாய்மொழி-அல்லாத ஆங்கில எழுத்தாளர்களுக்கு சராசரி 61.3% தவறான-நேர்மறை விகிதம் கண்டறியப்பட்டது; OpenAI தனது கண்டறிவானை 2023-இல் குறைந்த துல்லியத்தால் மூடியது. தமிழ் போன்ற குறைந்த-வள மொழிகளுக்கு இது இன்னும் மோசம். கண்டறிவானின் முடிவை இறுதி ஆதாரமாக கருதாதீர்கள்.

தமிழ் LLM-களுக்கு ஒப்பீட்டளவில் நடுத்தர/குறைந்த-வளம் கொண்ட மொழி — ஹிந்திக்கு பின்னால், ஆங்கிலம்/ஐரோப்பிய மொழிகளை விட பின்னால். ஒரு தொழில்நுட்ப எச்சரிக்கை: தமிழ் உரைக்கு ஆங்கிலத்தை விட ~2 மடங்கு டோக்கன்கள் தேவை, இது செலவை/வரம்பை அதிகரிக்கிறது. IndicGenBench (Google ஆராய்ச்சி) படி, சிறந்த மாதிரிகளும் கூட இந்திய மொழிகளில் ஆங்கிலத்தை விட குறிப்பிடத்தக்க இடைவெளி காட்டுகின்றன. வழங்குநரின் «மிகச் சிறந்தது» கூற்று வழங்குநரின் கூற்றே; குறிப்பிட்ட தரவரிசை தருமுன் சரிபார்க்கவும்.

மேலும் படிக்க

இந்த கட்டுரை பொதுத் தகவலுக்காக; இது தொழில்முறை, சட்ட அல்லது நிதி ஆலோசனை அல்ல. AI கருவிகள், விலை, கிடைக்கும் தன்மை வேகமாக மாறுகின்றன — எந்த முடிவுக்கும் அடிப்படையாக்கும் முன் அதிகாரப்பூர்வ பக்கத்திலிருந்து சமீபத்திய தகவலை சரிபார்க்கவும்.