هوش مصنوعی برای یادگیری، به داده نیاز دارد. این دادهها از منابع مختلف دیجیتال مانند وبسایتها، کتابهای دیجیتال، مقالات، و پایگاههای دانش گردآوری میشوند. اما این منابع بهطور یکنواخت در سراسر جهان توزیع نشدهاند. برخی زبانها، بهویژه زبانهایی که در علم، فناوری، و اینترنت حضور گستردهتری داشتهاند، حجم بسیار بیشتری از محتوای دیجیتال تولید کردهاند. بهعنوان نمونه، پایگاههایی مانند ویکی پدیا در نسخهٔ انگلیسی خود چندین برابر بزرگتر از بسیاری از نسخههای دیگر زبانی هستند. این تفاوت در حجم، بهمعنای تفاوت در دسترسپذیری است.
عامل دیگر، مسئلهٔ دیجیتالسازی است. بخش بزرگی از دانش بشری هنوز در قالبهای غیر دیجیتال وجود دارد: کتابهای چاپی با تیراژ محدود، اسناد محلی، آرشیوهای منطقهای، و روایتهای شفاهی. پروژههایی مانند Internet Archive تلاش میکنند این منابع را حفظ و دیجیتال کنند، اما این فرایند هنوز کامل نشده است. در نتیجه، آنچه دیجیتال شده، سهم بیشتری در آموزش و شکلگیری سیستمهای هوش مصنوعی دارد.
این وضعیت نشان میدهد که هوش مصنوعی نه به کل دانش موجود، بلکه به کل دانش در دسترس دیجیتال دسترسی دارد. این تمایز مهم است. زیرا دسترسی، تابع حضور دیجیتال است، و حضور دیجیتال خود تابع زیرساختها، اولویتها، و مسیرهای تاریخی متفاوت است.
در عین حال، این وضعیت ثابت نیست. با گسترش دسترسی به اینترنت، افزایش تولید محتوای چندزبانه، و توسعهٔ پروژههای آرشیوی، دامنهٔ دادههای در دسترس در حال گسترش است. هر متن دیجیتالشده، هر مقالهٔ جدید، و هر منبعی که به فضای دیجیتال افزوده میشود، بهنوعی بخشی از حافظهٔ قابل دسترس برای سیستمهای آینده را شکل میدهد.
در این چارچوب، هوش مصنوعی را میتوان نه صرفاً یک فناوری، بلکه نوعی «بازتاب حافظهٔ دیجیتال بشر» دانست. حافظهای که در حال گسترش است، اما همچنان ساختار آن تحت تأثیر مسیرهایی است که دانش از طریق آنها ثبت، ذخیره، و منتقل شده است.
پیام آذربایجان
