Menu

AI ప్రపంచంలో కనిపించని భాషలు.. ప్రపంచానికి ఆఫ్రికా చెప్పని కథ

Lakshmi Aruna 2 weeks ago

ఒక భాషను చదవడం నేర్పాలంటే ముందుగా చదవడానికి ఏదో ఒకటి ఉండాలి. అక్షరాలు, పదాలు, వాక్యాలు, కథలు, పుస్తకాలు.. ఇవన్నీ లేకపోతే మనిషికైనా భాష నేర్పడం కష్టం. అదే పరిస్థితి ఇప్పుడు ఆఫ్రికా ఖండంలో ఆర్టిఫిషియల్ ఇంటెలిజెన్స్‌కు ఎదురవుతోంది. AIకి భాష నేర్పాలంటే దానికి చదవడానికి డేటా కావాలి. కానీ చాలా ఆఫ్రికన్ భాషలకు చదవడానికి ఏమీ లేదు. ఇదే ఈరోజు ఆఫ్రికన్ AI డెవలపర్ల ముందు ఉన్న అతిపెద్ద సమస్య.

ఆఫ్రికా అనేది భాషలతో నిండిన ఖండం. ప్రపంచంలో ఎక్కడా లేనంతగా, ఇక్కడ 1500 నుంచి 3000 వరకు భాషలు మాట్లాడబడుతున్నాయి. ఒక్కో భాష వెనుక ఒక చరిత్ర ఉంది, ఒక సంస్కృతి ఉంది, ఒక జీవన విధానం ఉంది. కానీ ఈ భాషలలో చాలా వరకు డిజిటల్ ప్రపంచంలో లేవు. ఇంటర్నెట్‌లో కనిపించవు. పుస్తకాలుగా మారలేదు. వికీపీడియాలోనూ చోటు దక్కలేదు. ఫలితంగా, AIకి ఈ భాషల గురించి “తెలియనే తెలియదు”.

ఇంగ్లీష్ లాంటి భాషలను తీసుకుంటే పరిస్థితి పూర్తిగా భిన్నంగా ఉంటుంది. ఇంగ్లీష్‌లో కోట్లకొద్దీ వ్యాసాలు, పుస్తకాలు, మాన్యువల్స్, ఆన్‌లైన్ కంటెంట్ అందుబాటులో ఉన్నాయి. అందుకే AIకి ఇంగ్లీష్ అర్థం అవుతుంది, స్పందిస్తుంది, సంభాషిస్తుంది. కానీ ఆఫ్రికాలోని చాలా భాషలకు ఈ అదృష్టం లేదు. ఉదాహరణకు, టిగ్రిన్యా అనే భాషను దాదాపు 90 లక్షల మంది మాట్లాడుతున్నా, ఆ భాషలో వికీపీడియాలో ఉన్న వ్యాసాలు వందల సంఖ్యలో మాత్రమే. ఘానాలో ఎక్కువగా మాట్లాడే అకాన్ భాషకు అయితే వికీపీడియాలో ఒక్క వ్యాసం కూడా లేదు. అంటే, మాట్లాడే వారు ఉన్నారు కానీ చదవడానికి ఏమీ లేదు.

ఇంత భారీ సంఖ్యలో భాషలు ఉన్నా, ప్రస్తుతం ప్రపంచంలో ఉపయోగంలో ఉన్న AI లాంగ్వేజ్ మోడల్స్ కేవలం 42 ఆఫ్రికన్ భాషలకే మద్దతు ఇస్తున్నాయి. ఇంకా ఆశ్చర్యకరమైన విషయం ఏమిటంటే, ఆఫ్రికాలో ఉపయోగంలో ఉన్న 23 రకాల లిపులు, అక్షరమాలల్లో AIకి అందుబాటులో ఉన్నవి కేవలం మూడు మాత్రమే. అంటే, చాలా భాషలు మాట్లాడుతున్నా, రాసినా, AI దృష్టిలో అవి అసలు లేనట్టే.

ఈ వెనుక కారణం సాంకేతికం కంటే ఆర్థికం ఎక్కువ. పెద్ద టెక్ కంపెనీలు ఎక్కడ మార్కెట్ ఉంటే అక్కడే పెట్టుబడి పెడతాయి. స్వాహిలీ భాష మాట్లాడే వారి సంఖ్య ఫిన్నిష్ మాట్లాడే వారికంటే ఎక్కువైనా, వ్యాపార పరంగా ఫిన్లాండ్ పెద్ద మార్కెట్‌గా కనిపిస్తుంది. అందుకే టెక్నాలజీ అక్కడికి వెళ్తుంది. భాషల సంఖ్య కాదు, కొనుగోలు శక్తి ముఖ్యమవుతుంది. ఈ ఆలోచనా విధానమే ఆఫ్రికన్ భాషలను AI ప్రపంచానికి దూరం చేస్తోంది.

ఈ పరిస్థితి ఇలానే కొనసాగితే పరిణామాలు తీవ్రంగా ఉంటాయని నిపుణులు హెచ్చరిస్తున్నారు. ఇప్పటికే ప్రపంచం డిజిటల్ వైపు వేగంగా వెళ్తోంది. రేపు ఉద్యోగాలు, ఆరోగ్య సేవలు, బ్యాంకింగ్, విద్య అన్నీ AI ఆధారంగా మారితే, ఈ 42 భాషలు మాట్లాడని కోట్లాది మంది అవకాశాల నుంచి బయటకు నెట్టబడతారు. భాష అర్థం కాకపోవడం అంటే సమాచారం దూరమవడం. సమాచారం దూరమవడం అంటే అభివృద్ధి దూరమవడం.

ఈ సమస్యను మార్చడానికి కొందరు పరిశోధకులు సంప్రదాయ మార్గాలకు భిన్నంగా ఆలోచించారు. పుస్తకాలు లేవంటే పుస్తకాల కోసం ఎదురు చూడకుండా, ప్రజల మాటలనే డేటాగా మార్చాలని నిర్ణయించారు. ఆ ఆలోచన నుంచే “ఆఫ్రికన్ నెక్ట్స్ వాయిసెస్” లాంటి ప్రాజెక్టులు పుట్టాయి. ఈ ప్రాజెక్ట్‌లో భాగంగా, వివిధ దేశాల్లోని స్థానిక భాషల్ని మాట్లాడే ప్రజలతో మాట్లాడి, వారి మాటలను రికార్డ్ చేసి, వాటిని టెక్స్ట్‌గా మార్చారు.

రెండు సంవత్సరాల పాటు సాగిన ఈ ప్రయత్నంలో వేల గంటల వాయిస్ డేటాను సేకరించారు. వయస్సులు, ప్రాంతాలు, జీవన విధానాలు వేరువేరు అయిన ప్రజల మాటలు ఇందులో ఉన్నాయి. కొన్నిసార్లు వాళ్లకు చదవడానికి స్క్రిప్టులు ఇచ్చారు. కానీ చాలా సందర్భాల్లో కేవలం ఒక ప్రశ్న వేసి, వాళ్ల సమాధానాలను రికార్డ్ చేశారు. కొన్ని భాషలకు రాత రూపం దొరకకపోవడంతో, గొర్రెలు, మేకల పెంపకానికి సంబంధించిన ప్రభుత్వ మాన్యువల్స్‌ని కూడా ఆధారంగా తీసుకోవాల్సి వచ్చింది.

ఈ డేటా పెద్ద AI మోడల్స్ తయారుచేయడానికి సరిపోదు. కానీ ఇది మరో ముఖ్యమైన విషయం చెబుతుంది. అన్ని భాషలకు ఒకే రకమైన AI అవసరం లేదు. ప్రతి భాషకు, ప్రతి ప్రాంతానికి అవసరమైన అంశాలపై దృష్టి పెట్టిన చిన్న మోడల్స్ చాలా ప్రభావవంతంగా పని చేయగలవు. ఆరోగ్యం, వ్యవసాయం, స్థానిక సేవల లాంటి రంగాల్లో చిన్న కానీ ఖచ్చితమైన AI మోడల్స్ ఎంతో ఉపయోగపడతాయి.

ఇక్కడే మరో కీలక సమస్య బయటపడుతుంది. భాష అనేది కేవలం పదాల సమాహారం కాదు. ప్రతి పదానికి ఒక నేపథ్యం ఉంటుంది. ఒక గుర్తు, ఒక చిహ్నం ఒక దేశంలో ఒక అర్థం చెప్పొచ్చు, మరో దేశంలో మరో అర్థం చెప్పొచ్చు. ఈ సాంస్కృతిక అవగాహన లేకుండా AI నిర్ణయాలు తీసుకుంటే ప్రమాదాలు జరగవచ్చు. ముఖ్యంగా ద్వేష ప్రసంగాలు, సామాజిక ఉద్రిక్తతల విషయంలో ఇది మరింత ప్రమాదకరం.

ఇప్పటికే కొన్ని సందర్భాల్లో, స్థానిక పదాలు, స్లాంగ్ అర్థం కాక సోషల్ మీడియా ప్లాట్‌ఫాంలు హింసను గుర్తించడంలో విఫలమయ్యాయి. ఇది కేవలం టెక్నాలజీ వైఫల్యం కాదు. ఇది సంస్కృతి అర్థం చేసుకోలేకపోవడం వల్ల వచ్చిన లోపం.

ఇంకో పెద్ద సమస్య ఏమిటంటే, చాలా ఆఫ్రికన్ భాషలకు సరైన వ్యాకరణ నియమాలు, నిఘంటువులు లేవు. ఒకే పదాన్ని రాయడానికి మూడు నాలుగు విధానాలు ఉన్నాయి. ఇలాంటి పరిస్థితుల్లో AIకి స్పెల్లింగ్ నేర్పడం కూడా పెద్ద సవాలుగా మారుతుంది. అంతేకాదు, డేటా సెంటర్లు లేకపోవడం వల్ల ఈ ఖండంలో AI అభివృద్ధి మరింత నెమ్మదిగా జరుగుతోంది.

ఈ అన్ని అడ్డంకుల మధ్య కూడా ఒక భయం నిపుణులను వెంటాడుతోంది. ఈ భాషల కోసం ఇప్పుడే ప్రయత్నం చేయకపోతే, అవి కేవలం AIలోనే కాదు, భవిష్యత్తులో మనుషుల జీవితాల్లో కూడా మెల్లగా మాయమవుతాయేమో అనే భయం. రాత రూపం లేకుండా, డిజిటల్ ముద్ర లేకుండా ఒక భాష నిలబడటం చాలా కష్టం.

అందుకే, రాబోయే రోజుల్లో AI మోడల్స్ మాత్రమే కాదు, భాషల్ని చూసే విధానం కూడా మారాల్సిన అవసరం ఉంది. పుస్తకాలతో మొదలయ్యే భాషా ప్రయాణం కాకుండా, మనుషుల మాటలతో మొదలయ్యే భవిష్యత్తు వైపు ప్రపంచం అడుగులు వేయాల్సిన సమయం ఇదే.

ALSO READ: ఎక్కడికి వెళ్తున్నాం మనం? నిహిలిస్ట్ పెంగ్విన్ ప్రశ్న..!


Written By

P. Lakshmi Aruna is an anchor, sub-editor, and freelance journalist who focuses on stories of women empowerment and humanity. A passionate storyteller and committed lifelong learner, she continues to grow every day in her craft and her purpose. Contact Details: prajadhwaninewstelugu@gmail.com

Leave a Reply

Leave a Reply

Your email address will not be published. Required fields are marked *