ఒక భాషను చదవడం నేర్పాలంటే ముందుగా చదవడానికి ఏదో ఒకటి ఉండాలి. అక్షరాలు, పదాలు, వాక్యాలు, కథలు, పుస్తకాలు.. ఇవన్నీ లేకపోతే మనిషికైనా భాష నేర్పడం కష్టం. అదే పరిస్థితి ఇప్పుడు ఆఫ్రికా ఖండంలో ఆర్టిఫిషియల్ ఇంటెలిజెన్స్కు ఎదురవుతోంది. AIకి భాష నేర్పాలంటే దానికి చదవడానికి డేటా కావాలి. కానీ చాలా ఆఫ్రికన్ భాషలకు చదవడానికి ఏమీ లేదు. ఇదే ఈరోజు ఆఫ్రికన్ AI డెవలపర్ల ముందు ఉన్న అతిపెద్ద సమస్య.
ఆఫ్రికా అనేది భాషలతో నిండిన ఖండం. ప్రపంచంలో ఎక్కడా లేనంతగా, ఇక్కడ 1500 నుంచి 3000 వరకు భాషలు మాట్లాడబడుతున్నాయి. ఒక్కో భాష వెనుక ఒక చరిత్ర ఉంది, ఒక సంస్కృతి ఉంది, ఒక జీవన విధానం ఉంది. కానీ ఈ భాషలలో చాలా వరకు డిజిటల్ ప్రపంచంలో లేవు. ఇంటర్నెట్లో కనిపించవు. పుస్తకాలుగా మారలేదు. వికీపీడియాలోనూ చోటు దక్కలేదు. ఫలితంగా, AIకి ఈ భాషల గురించి “తెలియనే తెలియదు”.
ఇంగ్లీష్ లాంటి భాషలను తీసుకుంటే పరిస్థితి పూర్తిగా భిన్నంగా ఉంటుంది. ఇంగ్లీష్లో కోట్లకొద్దీ వ్యాసాలు, పుస్తకాలు, మాన్యువల్స్, ఆన్లైన్ కంటెంట్ అందుబాటులో ఉన్నాయి. అందుకే AIకి ఇంగ్లీష్ అర్థం అవుతుంది, స్పందిస్తుంది, సంభాషిస్తుంది. కానీ ఆఫ్రికాలోని చాలా భాషలకు ఈ అదృష్టం లేదు. ఉదాహరణకు, టిగ్రిన్యా అనే భాషను దాదాపు 90 లక్షల మంది మాట్లాడుతున్నా, ఆ భాషలో వికీపీడియాలో ఉన్న వ్యాసాలు వందల సంఖ్యలో మాత్రమే. ఘానాలో ఎక్కువగా మాట్లాడే అకాన్ భాషకు అయితే వికీపీడియాలో ఒక్క వ్యాసం కూడా లేదు. అంటే, మాట్లాడే వారు ఉన్నారు కానీ చదవడానికి ఏమీ లేదు.
ఇంత భారీ సంఖ్యలో భాషలు ఉన్నా, ప్రస్తుతం ప్రపంచంలో ఉపయోగంలో ఉన్న AI లాంగ్వేజ్ మోడల్స్ కేవలం 42 ఆఫ్రికన్ భాషలకే మద్దతు ఇస్తున్నాయి. ఇంకా ఆశ్చర్యకరమైన విషయం ఏమిటంటే, ఆఫ్రికాలో ఉపయోగంలో ఉన్న 23 రకాల లిపులు, అక్షరమాలల్లో AIకి అందుబాటులో ఉన్నవి కేవలం మూడు మాత్రమే. అంటే, చాలా భాషలు మాట్లాడుతున్నా, రాసినా, AI దృష్టిలో అవి అసలు లేనట్టే.
ఈ వెనుక కారణం సాంకేతికం కంటే ఆర్థికం ఎక్కువ. పెద్ద టెక్ కంపెనీలు ఎక్కడ మార్కెట్ ఉంటే అక్కడే పెట్టుబడి పెడతాయి. స్వాహిలీ భాష మాట్లాడే వారి సంఖ్య ఫిన్నిష్ మాట్లాడే వారికంటే ఎక్కువైనా, వ్యాపార పరంగా ఫిన్లాండ్ పెద్ద మార్కెట్గా కనిపిస్తుంది. అందుకే టెక్నాలజీ అక్కడికి వెళ్తుంది. భాషల సంఖ్య కాదు, కొనుగోలు శక్తి ముఖ్యమవుతుంది. ఈ ఆలోచనా విధానమే ఆఫ్రికన్ భాషలను AI ప్రపంచానికి దూరం చేస్తోంది.
ఈ పరిస్థితి ఇలానే కొనసాగితే పరిణామాలు తీవ్రంగా ఉంటాయని నిపుణులు హెచ్చరిస్తున్నారు. ఇప్పటికే ప్రపంచం డిజిటల్ వైపు వేగంగా వెళ్తోంది. రేపు ఉద్యోగాలు, ఆరోగ్య సేవలు, బ్యాంకింగ్, విద్య అన్నీ AI ఆధారంగా మారితే, ఈ 42 భాషలు మాట్లాడని కోట్లాది మంది అవకాశాల నుంచి బయటకు నెట్టబడతారు. భాష అర్థం కాకపోవడం అంటే సమాచారం దూరమవడం. సమాచారం దూరమవడం అంటే అభివృద్ధి దూరమవడం.
ఈ సమస్యను మార్చడానికి కొందరు పరిశోధకులు సంప్రదాయ మార్గాలకు భిన్నంగా ఆలోచించారు. పుస్తకాలు లేవంటే పుస్తకాల కోసం ఎదురు చూడకుండా, ప్రజల మాటలనే డేటాగా మార్చాలని నిర్ణయించారు. ఆ ఆలోచన నుంచే “ఆఫ్రికన్ నెక్ట్స్ వాయిసెస్” లాంటి ప్రాజెక్టులు పుట్టాయి. ఈ ప్రాజెక్ట్లో భాగంగా, వివిధ దేశాల్లోని స్థానిక భాషల్ని మాట్లాడే ప్రజలతో మాట్లాడి, వారి మాటలను రికార్డ్ చేసి, వాటిని టెక్స్ట్గా మార్చారు.
రెండు సంవత్సరాల పాటు సాగిన ఈ ప్రయత్నంలో వేల గంటల వాయిస్ డేటాను సేకరించారు. వయస్సులు, ప్రాంతాలు, జీవన విధానాలు వేరువేరు అయిన ప్రజల మాటలు ఇందులో ఉన్నాయి. కొన్నిసార్లు వాళ్లకు చదవడానికి స్క్రిప్టులు ఇచ్చారు. కానీ చాలా సందర్భాల్లో కేవలం ఒక ప్రశ్న వేసి, వాళ్ల సమాధానాలను రికార్డ్ చేశారు. కొన్ని భాషలకు రాత రూపం దొరకకపోవడంతో, గొర్రెలు, మేకల పెంపకానికి సంబంధించిన ప్రభుత్వ మాన్యువల్స్ని కూడా ఆధారంగా తీసుకోవాల్సి వచ్చింది.
ఈ డేటా పెద్ద AI మోడల్స్ తయారుచేయడానికి సరిపోదు. కానీ ఇది మరో ముఖ్యమైన విషయం చెబుతుంది. అన్ని భాషలకు ఒకే రకమైన AI అవసరం లేదు. ప్రతి భాషకు, ప్రతి ప్రాంతానికి అవసరమైన అంశాలపై దృష్టి పెట్టిన చిన్న మోడల్స్ చాలా ప్రభావవంతంగా పని చేయగలవు. ఆరోగ్యం, వ్యవసాయం, స్థానిక సేవల లాంటి రంగాల్లో చిన్న కానీ ఖచ్చితమైన AI మోడల్స్ ఎంతో ఉపయోగపడతాయి.
ఇక్కడే మరో కీలక సమస్య బయటపడుతుంది. భాష అనేది కేవలం పదాల సమాహారం కాదు. ప్రతి పదానికి ఒక నేపథ్యం ఉంటుంది. ఒక గుర్తు, ఒక చిహ్నం ఒక దేశంలో ఒక అర్థం చెప్పొచ్చు, మరో దేశంలో మరో అర్థం చెప్పొచ్చు. ఈ సాంస్కృతిక అవగాహన లేకుండా AI నిర్ణయాలు తీసుకుంటే ప్రమాదాలు జరగవచ్చు. ముఖ్యంగా ద్వేష ప్రసంగాలు, సామాజిక ఉద్రిక్తతల విషయంలో ఇది మరింత ప్రమాదకరం.
ఇప్పటికే కొన్ని సందర్భాల్లో, స్థానిక పదాలు, స్లాంగ్ అర్థం కాక సోషల్ మీడియా ప్లాట్ఫాంలు హింసను గుర్తించడంలో విఫలమయ్యాయి. ఇది కేవలం టెక్నాలజీ వైఫల్యం కాదు. ఇది సంస్కృతి అర్థం చేసుకోలేకపోవడం వల్ల వచ్చిన లోపం.
ఇంకో పెద్ద సమస్య ఏమిటంటే, చాలా ఆఫ్రికన్ భాషలకు సరైన వ్యాకరణ నియమాలు, నిఘంటువులు లేవు. ఒకే పదాన్ని రాయడానికి మూడు నాలుగు విధానాలు ఉన్నాయి. ఇలాంటి పరిస్థితుల్లో AIకి స్పెల్లింగ్ నేర్పడం కూడా పెద్ద సవాలుగా మారుతుంది. అంతేకాదు, డేటా సెంటర్లు లేకపోవడం వల్ల ఈ ఖండంలో AI అభివృద్ధి మరింత నెమ్మదిగా జరుగుతోంది.
ఈ అన్ని అడ్డంకుల మధ్య కూడా ఒక భయం నిపుణులను వెంటాడుతోంది. ఈ భాషల కోసం ఇప్పుడే ప్రయత్నం చేయకపోతే, అవి కేవలం AIలోనే కాదు, భవిష్యత్తులో మనుషుల జీవితాల్లో కూడా మెల్లగా మాయమవుతాయేమో అనే భయం. రాత రూపం లేకుండా, డిజిటల్ ముద్ర లేకుండా ఒక భాష నిలబడటం చాలా కష్టం.
అందుకే, రాబోయే రోజుల్లో AI మోడల్స్ మాత్రమే కాదు, భాషల్ని చూసే విధానం కూడా మారాల్సిన అవసరం ఉంది. పుస్తకాలతో మొదలయ్యే భాషా ప్రయాణం కాకుండా, మనుషుల మాటలతో మొదలయ్యే భవిష్యత్తు వైపు ప్రపంచం అడుగులు వేయాల్సిన సమయం ఇదే.
ALSO READ: ఎక్కడికి వెళ్తున్నాం మనం? నిహిలిస్ట్ పెంగ్విన్ ప్రశ్న..!

AI: మీ అప్పుల బాధను తీర్చే ఏఐ..మనం సంపాదించే ప్రతి రూపాయికి టెక్నాలజీ రక్ష!
Careers and Education: డిగ్రీతో ఉపయోగం లేదు.. ఈ స్కిల్స్ ఉంటే మాత్రం జాబ్ ఫిక్స్!
తెలంగాణ విద్యాసంస్థల్లో Facial Recognition హాజరు: లాభమా? నష్టమా?
AI Fake Videos: AIతో పచ్చి బూతులు.. వికృత బుద్ధి చూపిస్తోన్న మగాళ్లు!
Donald trump USAID: మానవత్వం మరిచిన ట్రంప్.. డబ్బుల కక్కుర్తితో పేద దేశాల ప్రజల కడుపు మాడ్చుతున్న ప్రెసిడెంట్!