Matematika pas abonimeve të AI po fillon të bëhet shqetësuese. Modelet me çmim fiks mujor, që ndihmuan në shpërthimin e shpejtë të mjeteve si ChatGPT dhe Claude, po rezultojnë gjithnjë e më pak të qëndrueshme financiarisht. Sa më shumë përdorues i shtyjnë këto sisteme drejt limiteve të tyre, me kode të gjata, agjentë autonomë dhe flukse pune komplekse – aq më e madhe bëhet hendeku mes të ardhurave dhe kostove reale të infrastrukturës.
Një analizë e detajuar nga SemiAnalysis e bën këtë problem shumë konkret. Duke testuar planet e abonimit të OpenAI dhe Anthropic deri në kufijtë maksimalë të përdorimit, firma zbuloi se kostot teorike të përdorimit, nëse do të tarifoheshin sipas çmimeve API, janë marramendëse. Një abonim ChatGPT Pro prej 200 dollarësh në muaj mund të përkthehet në rreth 14 mijë dollarë kosto reale, ndërsa Claude Max arrin afërsisht 8 mijë dollarë.
Kjo shpjegon pse normat e përdorimit janë kaq kritike. Sipas SemiAnalysis, Anthropic fillon të dalë në zero fitim me rreth 20% përdorim, ndërsa OpenAI hyn në humbje shumë më herët. Në planet më të avancuara, mjafton një përdorim relativisht modest që marzhet të bëhen negative.
Presioni vjen edhe nga mënyra se si përdoret AI sot. Sistemet agjentike konsumojnë deri në 1,000 herë më shumë tokenë sesa një kërkesë e thjeshtë. Kjo ka bërë që gjigantë si Microsoft, Meta dhe Amazon të frenojnë përdorimin e pakontrolluar brenda organizatave të tyre.

Zgjidhja që po fiton terren është “drejtimi inteligjent”, pasi detyrat komplekse shkojnë te modelet më të shtrenjta, ndërsa puna rutinë te alternativa më të lira ose open-source. Një raport i Wall Street Journal sugjeron se kjo qasje mund të ulë kostot deri në 95%.
Edhe CEO i OpenAI, Sam Altman, e ka pranuar se rritja e kostove të tokenëve është një sfidë serioze. Pyetja tani nuk është nëse modeli i abonimeve do të ndryshojë, por sa shpejt, dhe kush do ta paguajë faturën.

