China: చైనా స్వదేశీ చిప్లతో అతిపెద్ద AI మోడల్ 'లాంగ్క్యాట్-2.0' విడుదల
ఈ వార్తాకథనం ఏంటి
చైనాకు చెందిన ప్రముఖ ఫుడ్ డెలివరీ సంస్థ మెయిటువాన్ పూర్తిగా స్వదేశీ హార్డ్వేర్తో శిక్షణ పొందిన దేశంలోని అతిపెద్ద కృత్రిమ మేధ (AI) మోడల్ లాంగ్క్యాట్-2.0 (LongCat-2.0)ను ఆవిష్కరించింది. ఈ భారీ లార్జ్ లాంగ్వేజ్ మోడల్ (LLM)లో 1.6 ట్రిలియన్ పారామీటర్లు ఉండగా,ఒకేసారి 10 లక్షల టోకెన్ల వరకు సమాచారాన్ని ప్రాసెస్ చేసే సామర్థ్యం ఉంది. దీంతో ఈ ఏడాది ఏప్రిల్లో విడుదలైన డీప్సీక్ ఫ్లాగ్షిప్ మోడల్ V4-proకు సమాన స్థాయిలో నిలిచింది. లాంగ్క్యాట్-2.0 ప్రత్యేకత ఏమిటంటే,ఇది పూర్తిగా చైనాలో తయారైన హార్డ్వేర్పైనే అభివృద్ధి చేయబడింది. డీప్సీక్ V4-proలో దేశీయ చిప్లను ప్రధానంగా ఇన్ఫరెన్స్ కోసం ఉపయోగించగా, లాంగ్క్యాట్-2.0లో ప్రీ-ట్రైనింగ్తో పాటు ఇన్ఫరెన్స్ ప్రక్రియలన్నీ స్వదేశీ హార్డ్వేర్పైనే నిర్వహించారు.
వివరాలు
AI శిక్షణను విజయవంతంగా నిర్వహించే సామర్థ్యం
ప్రీ-ట్రైనింగ్ అనేది భారీ డేటాను విశ్లేషిస్తూ AI మోడల్కు ప్రాథమిక అవగాహన కల్పించే అత్యంత క్లిష్టమైన దశగా భావిస్తారు. ఈ మోడల్ను "పదివేల సంఖ్యలో AI ASIC సూపర్పాడ్లతో కూడిన భారీ క్లస్టర్ల"పై రూపొందించినట్లు మెయిటువాన్ వెల్లడించింది. ప్రత్యామ్నాయ హార్డ్వేర్ వేదికలపైనా అత్యాధునిక స్థాయి AI శిక్షణను విజయవంతంగా నిర్వహించే సామర్థ్యం తమకు ఉందని కంపెనీ తెలిపింది.
వివరాలు
హువావే కలెక్టివ్ కమ్యూనికేషన్ లైబ్రరీ
హార్డ్వేర్ను సరఫరా చేసిన సంస్థ పేరును మెయిటువాన్ వెల్లడించకపోయినా, శిక్షణ ప్రక్రియలో హువావే కలెక్టివ్ కమ్యూనికేషన్ లైబ్రరీ (HCCL)ను ఉపయోగించినట్లు తెలిపింది. ఇది చిప్ల మధ్య వేగవంతమైన సమాచార మార్పిడిని నిర్వహించే వ్యవస్థ. ఎన్విడియా రూపొందించిన కలెక్టివ్ కమ్యూనికేషన్ లైబ్రరీకి సమానంగా పనిచేసే ఈ సాంకేతికత ద్వారా శిక్షణ మరింత స్థిరంగా సాగిందని కంపెనీ పేర్కొంది. చైనా స్వదేశీ సాంకేతికతతో అత్యాధునిక AI మోడళ్లను రూపొందించే దిశగా ఇది మరో కీలక అడుగుగా నిపుణులు భావిస్తున్నారు.