Sarvam (Sarvam AI, பெங்களூரு) இந்திய மொழிகளுக்கு கவனம் செலுத்தும் திறந்த-எடை மாதிரிகள் — Sarvam-M (24B, Apache-2.0) உரையாடல்/பகுத்தறிவு; Sarvam-105B (2026 பிப்ரவரி) இந்திய சார்வபௌம மாதிரி. தமிழ் ஆதரவு உண்டு.
ஒரே பார்வையில்
| அம்சம் | விவரம் |
|---|---|
| தயாரிப்பாளர் | Sarvam AI (பெங்களூரு, இந்தியா) |
| மாதிரிகள் | Sarvam-M (24B), Sarvam-105B |
| உரிமம் | Apache-2.0 (திறந்த-எடை) |
| தமிழ் | உண்டு (M-இல் ~8% பயிற்சி கலவை) |
நன்மைகள்
- திறந்த-எடை (Apache-2.0) — சொந்த சர்வரில் இயக்கலாம், தரவு வசிப்பிடம்
- தமிழ் உட்பட இந்திய மொழிகளுக்கு கவனம்
- Sarvam-105B இந்திய AI மிஷன் சார்வபௌம மாதிரி (22 மொழி)
குறைபாடுகள், கவனிக்க வேண்டியவை
- Sarvam-M பயிற்சி கலவையில் தமிழ் ~8% (ஹிந்தி ~28%) — தமிழ் தரம் ஹிந்திக்கு சமம் என்று எடுத்துக்கொள்ள வேண்டாம்
- வழங்குநர் தரவரிசை வழங்குநரின் கூற்றே — «GPT-ஐ வெல்லும்» அல்ல
- சொந்தமாக இயக்க தொழில்நுட்ப அறிவு + கம்ப்யூட் தேவை
யாருக்கு ஏற்றது?
தமிழ்/இந்திய மொழி கவனம், திறந்த-எடை, சுய-ஹோஸ்டிங், தரவு வசிப்பிடம் வேண்டும் டெவலப்பர், நிறுவனங்களுக்கு ஏற்றது.
சாட், ஆட்டோமேஷன், டிரான்ஸ்கிரிப்ஷன், படம் — ஒவ்வொன்றுக்கும் தனித்தனி சந்தா கட்டுகிறீர்களா? எல்லாவற்றையும் ஒரே இடத்தில் கொண்டுவருவதும் ஒரு வழி: osFoundry போன்ற ஏஜெண்ட் சார்ந்த (agentic) AI தளம் சாட், ஏஜெண்ட், நிறுவன ஆப்களை ஒன்றிணைத்து உங்கள் சொந்த விசையை (BYOK) கொண்டுவர அனுமதிக்கிறது — எந்த மாதிரி இயங்கும் என்பதை நீங்களே தீர்மானிக்கிறீர்கள்.
தமிழ்-திறன் கொண்ட திறந்த-எடை மாதிரிகள் உண்டு: AI4Bharat (IIT மெட்ராஸ், சென்னை) — IndicTrans2 (மொழிபெயர்ப்பு, MIT), IndicBERT v2 (புரிதல்/என்கோடர், MIT, உரையாடல் அல்ல), IndicF5/Indic-TTS (தமிழ் பேச்சு), IndicConformer (ASR, MIT); Sarvam AI — Sarvam-M (24B, Apache-2.0; தமிழ் ~8% பயிற்சி கலவை), Sarvam-105B (2026 பிப்ரவரி, Apache-2.0, 22 மொழி, இந்திய சார்வபௌம மாதிரி); Tamil-LLaMA (Abhinand, 7B, Llama-2 சார்ந்தது, 2023-கால, பராமரிக்கப்படவில்லை); Krutrim-2 (12B, கட்டுப்படுத்தப்பட்ட உரிமம்). இவை மிக சக்திவாய்ந்தவை என்பதால் அல்ல, தமிழ் மொழி + தரவு-வசிப்பிடம் + சுய-ஹோஸ்டிங் காரணமாக ஆர்வமூட்டுபவை — பட்டியலிடுங்கள், மகுடம் சூட்டாதீர்கள்.
திறந்த-எடை இந்திய/தமிழ் மாதிரிகள் ஒரு சொந்த மாதிரி கொண்டுவரும் (BYO) அடுக்காக அர்த்தமுள்ளவை — சொந்த சர்வரில் இயக்கலாம், தரவு உங்கள் கட்டுப்பாட்டில் இருக்கும். இவை «GPT-ஐ வெல்லும்» என்று முன்வைக்காதீர்கள்; வழங்குநர்/ஆய்வுக் கட்டுரை தரவரிசை வழங்குநரின் கூற்றே. «N மொழி ஆதரவு» என்பது ஒவ்வொன்றிலும் சம தமிழ் தரம் அல்ல, மற்றும் «திறந்த-எடை»-இன் உரிமம் வேறுபடும் (Apache/MIT vs கட்டுப்படுத்தப்பட்ட).
மேலும் படிக்க
இந்த கட்டுரை பொதுத் தகவலுக்காக; இது தொழில்முறை, சட்ட அல்லது நிதி ஆலோசனை அல்ல. AI கருவிகள், விலை, கிடைக்கும் தன்மை வேகமாக மாறுகின்றன — எந்த முடிவுக்கும் அடிப்படையாக்கும் முன் அதிகாரப்பூர்வ பக்கத்திலிருந்து சமீபத்திய தகவலை சரிபார்க்கவும்.