কৃত্ৰিম বুদ্ধিমত্তা - ১

ড° যুগল কলিতা, ক’লৰাডো, আমেৰিকা
Jul 13, 2025
5 min read

ড° যুগল কলিতা, ক’লৰাডো, আমেৰিকা

মানৱজাতিৰ উদ্ভৱ বহু কোটি বছৰৰ জৈৱিক ক্ৰমবিকাশৰ ফলত। অজৈৱ পদাৰ্থৰ পৰাই চাৰি হাজাৰ কোটি বছৰৰ আগতে ভাগ্যক্ৰমে জৈৱিক অণুৰ আৱিৰ্ভাৱ হৈছিল ৰসায়নিক প্ৰক্ৰিয়াৰ ফলস্বৰূপে। এনে জৈৱিক অণুৰ পৰাই কালক্ৰমে এককোষীয় জীৱৰ সৃষ্টি হৈছিল। দীঘলীয়া জৈৱিক ক্ৰমবিকাশৰ শেহতীয়া উদ্ভৱ মানৱ নামৰ প্ৰজাতিৰ ৬০ ৰ পৰা ২০ লাখ বছৰ আগতে।

মানুহ বা মানৱ জাতিক আমি সাধাৰণতে সৰ্ব্বশ্ৰেষ্ঠ জীৱ বুলি মানি লওঁ। কিন্তু কিয়? অন্য বহুত জীৱ-প্ৰজাতিৰ দৰে মানুহৰ পাঁচোটা ইন্দ্ৰিয় আছে -- চকু (দৃষ্টি), কাণ (শ্ৰৱণ), নাক (ঘ্ৰাণ), জিভা (স্বাদ) আৰু ছাল (স্পৰ্শ)। বহু জন্তুৰ ইন্দ্ৰিয় শক্তি মানুহতকৈ বেলেগ বা ভাল। যেনে বাদুলি, শিহু আৰু তিমিমাছে দূৰৰ নেদেখা বস্তুৰ অৱস্থান নিৰ্ণয় কৰিব পাৰে শব্দৰ ঢৌৰ প্ৰতিফলনৰ সহায়ত। মানুহৰ ইন্দ্ৰিয়সমূহ অন‍্য জীৱৰ ইন্দ্ৰিয়তকৈ বহুগুণে শ্রেষ্ঠ বুলি দাবী কৰিব নোৱাৰি ।

জীৱ-বৃক্ষত মানৱ প্ৰজাতি অন্য জীৱতকৈ উন্নত বুলি দাবী কৰাৰ এটা প্ৰধান কাৰণ ভাষাৰ ব্যৱহাৰ, ভাৱমূলক চিন্তা আৰু যুক্তি শক্তি -- যাক বুদ্ধিমত্তা বুলিও কোৱা হয়। কৃত্ৰিম বুদ্ধিমত্তা (artificial intelligence) বুলি ক'লে যিবিলাক কামত মানুহে সাধাৰণতে পাৰদৰ্শিতা দেখুৱায়, তেনে কাম কেনেকৈ যন্ত্ৰৰ দ্বাৰা সুকলমে কৰাব পাৰি, তাকে বুজোৱা হয়। এনে কাৰ্য্যৰ উদাহৰণ হ'ল -- নজনা কথা বা কাম শিকা, চিন্তাসহিত যুক্তি আৰু কাৰণ দৰ্শাই ভাষাৰ সহায়ত বক্তৱ‍্য প্ৰকাশ কৰা, নিজৰ স্থানগত পৰিৱেশৰ বিষয়ে জ্ঞান আয়ত্ত্ব কৰা, দৈনন্দিন বা ব্যৱসায়িক জীৱনৰ বিভিন্ন সমস্যাৰ সমাধান কৰা আৰু পৰিস্থিতি সাপেক্ষে প্ৰয়োজনীয় সিদ্ধান্ত লোৱা।

ড° যুগল কলিতা, কম্পিউটাৰ বিজ্ঞানৰ অধ্যাপক আৰু অধ্যক্ষ, ক’লৰাডো বিশ্ববিদ্যালয়, ক’লৰাডো স্প্ৰিংছ, ক’লৰাডো, আমেৰিকা — **ড° যুগল কলিতা, কম্পিউটাৰ বিজ্ঞানৰ অধ্যাপক আৰু অধ্যক্ষ,** **ক’লৰাডো বিশ্ববিদ্যালয়, ক’লৰাডো স্প্ৰিংছ, ক’লৰাডো, আমেৰিকা**

২০১২ ৰ পৰা এতিয়ালৈ যোৱা এক দশকতকৈ সামান্য অধিক এই কালচোৱাক কৃত্ৰিম বুদ্ধিমত্তা বা যান্ত্ৰিক শিক্ষণৰ দিন বুলি বহুতেই অভিহিত কৰিছে। কৃত্ৰিম বুদ্ধিমত্তাৰ দৈনন্দিন ব্যৱহাৰৰ উত্তম ব্যৱহাৰৰ প্ৰদৰ্শনৰ উদাহৰণ কেইটামান হ'ল: গুগল বা মাইক্ৰ'চফ্টৰ সন্ধান যন্ত্ৰ (search engine), ইউটিউব আৰু এমাজনৰ (Amazon) অনুমোদন যন্ত্ৰ (recommendation engine), স্বয়ংচালিত যান-বাহন (যেনে ৱেইম' কোম্পেনীৰ), ডবাখেলৰ দৰে কৌশল পৰিপূৰ্ণ খেলত অতি-মানৱীয় পাৰদৰ্শিতা দৰ্শন আৰু সৃজনীমূলক লিখন- অঙ্কণ- আৰু কলা-প্ৰতিভা।

ছবি ১: ইংৰাজীৰ পৰা অসমীয়ালৈ অনুবাদ

কৃত্ৰিম বুদ্ধিমত্তা বিষয়টোৰ অন্তৰ্গত উপ-বিষয়বোৰৰ মাজত বিশেষ উল্লেখনীয় কেইটামান হ'ল -- যান্ত্ৰিক শিক্ষা (machine learning), যুক্তি প্ৰদৰ্শন (reasoning), জ্ঞানৰ স্পষ্ট বিৱৰণ (knowledge representation), স্বয়ংক্ৰিয় পৰিকল্পনা স্ৰজন (automatic planning), স্বাভাৱিক ভাষা প্ৰক্ৰিয়াকৰণ (natural language processing), যন্ত্ৰমানৱ বিদ্যা (robotics), আৰু পৰিৱেশ সচেতনতা (perception)। কৃত্ৰিম বুদ্ধিমত্তাৰ গৱেষকসকলে বিভিন্ন কাৰিকৰী আৰু বৈজ্ঞানিক পদ্ধতিৰ সহায় লয়। ইয়াৰ ভিতৰত তথ্য সন্ধান প্ৰণালী (search), গাণিতিক অনুকুলন (mathematical optimization), গাণিতিক তৰ্কবিদ্যা, কৃত্ৰিম স্নায়ুকোষীয় জাল (artificial neural networks), পৰিসংখ্যা বিজ্ঞান (statistics), অৰ্থনীতি, ইত্যাদি।

এই চুটি প্ৰৱন্ধত কৃত্ৰিম বুদ্ধিমত্তাৰ দুটা উপ-বিষয়হে সামান্যকৈ উল্লেখ কৰা হব: স্বাভাৱিক ভাষা প্ৰক্ৰিয়াকৰণ আৰু কম্পিউটৰীয় দৃষ্টিশক্তি।

স্বাভাৱিক ভাষা প্ৰক্ৰিয়াকৰণ

কম্পিউটাৰ এটা বিশেষ যন্ত্ৰ। এই যন্ত্ৰৰ লগত যদি মানুহৰ ভাষাত কথিত বা লিখিতভাবে যোগাযোগ কৰাৰ প্ৰচেষ্টাকে স্বাভাৱিক ভাষা প্ৰক্ৰিয়াকৰণ (natural language processing) বুলি কোৱা হয়। কৃত্ৰিম বুদ্ধিমত্তাৰ এই উপ-বিভাগটোৰ ভিতৰত অধ্যয়ণ কৰা বিষয়বোৰৰ মাজত আছে

-- কথিত ভাষা চিনাক্তকৰণ (speech recognition)

— কথিত ভাষা উৎপাদন (speech generation)

— যান্ত্ৰিক অনুবাদ (machine translation),

— তথ্য নিষ্কাশন (information retrieval),

— প্ৰশ্নোত্তৰ (question answering), ইত্যাদি।

যান্ত্ৰিক অনুবাদ

গুগল, মাইক্ৰ'চফ্ট আৰু অ'পেনএআই (OpenAI) আদি কৃত্ৰিম বুদ্ধিমত্তা-যুক্ত ৱেবচাইট বা এপে বিভিন্ন ভাষাত লিখা শব্দ, বাক্য বা নথি-পত্ৰ অন্য ভাষালৈ মুহূৰ্ততে অনুবাদ কৰিব পাৰে কোনো মানুহৰ সহায় নোলোৱাকৈ। ২০২৫ চনৰ জুন মাহত গুগল অনুবাদত ২৪৯টা ভাষা আছে। অৰ্থাৎ ২৪৮ x ২৪৮ = ৬১,৫০৪ যোৰ ভাষাৰ মাজত ই অনুবাদ কৰিবলৈ সক্ষম। মাইক্ৰ'চফ্ট অনুবাদকে ১৮০টা ভাষা জানে, অৰ্থাৎ ১৭৯টা ভাষাৰ লেখা ১৭৯টা অন্য ভাষালৈ অনুবাদ কৰিব পাৰে। কোনো এজন মানুহৰ বাবে ইমানবোৰ ভাষা পাকৈতকৈ জনা আৰু তৎক্ষণাতে অনুবাদ কৰা সম্ভৱ নহয়। এটা বৃহৎ বহুজাতিক কোম্পেনীয়ে বহু হাজাৰ বিদগ্ধ ভাষাবিদক বহু কোটি ডলাৰ ভৰি নিযুক্তি দিলেও, এনে কাম মানুহৰ দ্বাৰা সম্ভৱপৰ নহয়। এনে কামৰ বাবে কৃত্ৰিম বুদ্ধিমত্তাৰ প্ৰয়োজন।

ছবি ২: প্ৰশ্নোত্তৰ, চেটজিপিটি জুন ২৪, ২০২৫

কম্পিউটাৰ যন্ত্ৰৰ ভিতৰত চফ্টৱেৰ কি ধৰণে লিখিব লাগিব, বহু ভাষাৰ পৰা বহু ভাষালৈ তাৎক্ষণিক অনুবাদৰ কাৰণে, এই বিষয়ৰ ওপৰত হাজাৰ-হাজাৰ ভাষাবিদ আৰু কম্পিউটাৰ বিজ্ঞানীয়ে বহু দশক ধৰি গৱেষণা কৰি আহিছে। যোৱা ১০-১২ বছৰতহে গুগল, মাইক্ৰ'চফ্ট আদি কোম্পেনীয়ে বৃহদাকাৰত এনে কাম কৰিবলৈ সক্ষম হৈছে। ২০১৫-১৬ চনলৈকে পৰিসংথ্যা বিজ্ঞানৰ সহায়ত যান্ত্ৰিক অনুবাদৰ বাবে লাগতিয়াল প্ৰণালীবোৰ লিখা হৈছিল। ২০১৬ চনৰ পৰা গুগলে কৃত্ৰিম স্নায়ুকোষীয় জালেৰে যান্ত্ৰিক অনুবাদৰ দিহা কৰি আহিছে। ছবি ১ত গুগল অনুবাদকে ইংৰাজীৰ পৰা অসমীয়ালৈ অনুবাদ কৰা কেইজোৰমান বাক্য দেখুওৱা হৈছে। অনুবাদ ২০২৫ৰ জুনৰ ২১ তাৰিখৰ। সহজ বাক‍্যৰ অনুবাদ ভালকৈয়ে কৰিব পাৰে যান্ত্ৰিক অনুবাদকবোৰে।

ছবি ৩: কম্পিউটৰীয় দৃষ্টিশক্তি, চেটজিপিটি জুন ২৩, ২০২৫

প্ৰশ্নোত্তৰ

কোনোবাই যদি কাৰোবাক এটা প্ৰশ্ন সোধে, তাৰ উত্তৰ দিবলৈ কিহৰ প্ৰয়োজন? প্ৰথম, কোৱাজন আৰু শুনাজনৰ মাজত বিষয়বস্তুৰ কিছু হ'লেও পাৰস্পৰিক জ্ঞান থাকিব লাগিব। দ্বিতীয়, প্ৰশ্নটো শুনাজনে বুজি পাব লাগিব -- অৰ্থাৎ প্ৰশ্নটো সোঁধোতাজনে এটা ভাষাৰ মাধ্যমেৰে অস্পষ্টতা বা দ্ব্যৰ্থতা নথকাকৈ সুধিব লাগিব। তৃতীয়, শুনাজনে নিজৰ ভাষাৰ জ্ঞানেৰে প্ৰশ্নটো বুজি পাব লাগিব। চাৰি, উত্তৰ দিওঁতাজনে বহু কথা জানে -- কিজানি বহু লাখ কথা জানে -- এইবোৰ কথাৰ মাজৰ পৰা লাগতিয়াল তথ্যখিনি অতি সোনকালে বাচি নিষ্কাশন কৰি উলিয়াব লাগিব। পাঁচ, উলিওৱা তথ্যবোৰ যুগুতাই ভাষাৰ মাধ্যমেৰে প্ৰকাশ কৰিব লাগিব যাতে সোধাজনে বুজি পায় আৰু সোধাজনৰ উদ্দেশ্য সিদ্ধি হয়। ওপৰত বৰ্ণোৱা কামখিনি মানুহে কোনো বিশেষ পুংখানুপুংখ স্পষ্ট প্ৰণালীৰে সাধাৰণতে নকৰে -- প্ৰণালীটোৰ বিষয়ে বহুল চিন্তা নকৰাকৈয়ে সচৰাচৰ উত্তৰ দিবলৈ সক্ষম হয় উত্তৰ দিওঁতাজনে। যদি এটা যন্ত্ৰই লাখ-লাখ মানুহৰ লাখ-কোটি প্ৰশ্ন কেইবা শ ভাষাত শুদ্ধকৈ আৰু অবিলম্বে দিবলৈ সক্ষম হয়, তেনে এটা চফ্টৱেৰ চালিত যন্ত্ৰ কি ধৰণে নিৰ্ম্মাণ কৰিব লাগিব, সেইটো কৃত্ৰিম বুদ্ধিমত্তাৰ বিজ্ঞানী আৰু অভিযন্তাসকলৰ গৱেষণাৰ বিষয়বস্তু। কি ধৰণে এনে বিশাল কাম সমাধা কৰা হয়, সেই আলোচনা এই প্ৰৱন্ধত বিশদভাবে কৰা সম্ভৱ নহয়। ভাষাবোৰৰ সাধাৰণ জ্ঞান আৰু লগতে কেইবালাখ প্ৰশ্ন আৰু সেই প্ৰশ্নবোৰৰ শুদ্ধ উত্তৰৰ এটা নমুনা-সংগ্ৰহৰ (dataset) প্ৰয়োজন যান্ত্ৰিক শিক্ষণৰ এটা যন্ত্ৰক প্ৰশিক্ষণ (training) দিয়াবলৈ। চেটজিপিটিৰ দৰে বৃহৎ কৃত্ৰিম স্নায়ুকোষীয় জালক বৃহদাকাৰ প্ৰশ্নোত্তৰ নমুনা-সংগ্ৰহৰ সহায়ত প্ৰশিক্ষন দিয়া হয়। চেটজিপিটিৰ লগত ২০২৫ৰ জুনৰ ২২ তাৰিখে হোৱা হোৱা এটা চমু প্ৰশ্নোত্তৰ বৈঠক ছবি ২ত দিয়া হ'ল।

কম্পিউটৰীয় দৃষ্টিশক্তি

আগতে উনুকিওৱা হৈছে যে চকু এটা মানৱীয় ইন্দ্ৰিয়। যেতিয়া মানুহে এটা বস্তু দেখে, প্ৰথমে সেই বস্তুৰ লগত জড়িত পোহৰৰ ৰশ্মিবোৰ চকুৰ ফলক-কাঁচত (lens) পৰে। এই ৰশ্মিবোৰ ফলক কাঁচৰ মাজেদি গৈ চকুৰ পিচফালে থকা আলোকীয় স্নায়ুগোটত (optical nerves) পৰে। তাৰ পিচত স্নায়ুকোষৰ দীঘলীয়া শৃংখলেৰে গৈ মস্তিস্কৰ পিচফালে থকা আলোকীয় স্নায়ুকেন্দ্ৰ (optical cortex) পায় — ইয়াতে এতিয়াও ভালকৈ নুবুজা প্ৰক্ৰিয়াৰ অন্তত মানুহৰ মস্তিস্কই চকুৰে কি দেখিলে সেইটো বুজি পায়।

মানুহে চকুৰে দেখি বিভিন্ন বস্তু চিনি পোৱাৰ দৰে কম্পিউটাৰকো শিকাব পাৰি দেখা বস্তু চিহ্নিত কৰিবলৈ। ইয়াকে কম্পিউটৰীয় দৃষ্টি বুলি কোৱা হয়। যোৱা পাঁচ দশকৰো অধিক কম্পিউটাৰ বিজ্ঞানীসকলে এই বিষয়ত গৱেষণা কৰি আছে। এই প্ৰৱন্ধত এই বিষয়ে দীঘলীয়াকৈ লিখাৰ অৱকাশ নহ'ব। কম্পিউটাৰ চফ্টৱেৰক ছবি বা আলোকচিত্ৰত থকা বস্তুবোৰ চিনাক্তকৰণত শিক্ষা দিবলৈ চিত্ৰ সংগ্ৰহৰ (dataset) প্ৰয়োজন। প্ৰত‍্যেকখন ছবি বা আলোকচিত্ৰৰ লগত এটা চিহ্ন-নাম (label) থাকে। কৃত্ৰিম স্নায়ুকোষীয় জালৰ সহায়েৰে কম্পিউটাৰে শিকি ল'ব পাৰে কোনটো বস্তুত থকা কি ঠাঁচবোৰ সেই বস্তুৰ পৰিচায়ক। তদুপৰি আজিকালি বৃহৎ বহুজাতিক কোম্পেনীবোৰে আগতীয়াকৈ প্ৰশিক্ষণ দিয়া বৃহদাকাৰ ভাষা চানেকীবোৰে (large language model) দেখা বস্তুবোৰৰ এটা বিৱৰণো দিব পাৰে। এনে এটা চেটজিপিটি-সৃষ্ট বিৱৰণ ছবি ৩ ত দিয়া হ’ল।

সমাপ্তি

কৃত্ৰিম বুদ্ধিমত্তা এটা বিশাল আৰু জীৱন্ত বিষয়। এই বিষয়ত বহুল গৱেষণা দেশে-বিদেশে, বিশেষকৈ আমেৰিকা আৰু চীনদেশত হৈ আছে। কৃত্ৰিম বুদ্ধিমত্তাৰ “যুগ” ২০১০ দশকৰ পৰা আৰম্ভ হ’লেও যোৱা ২-৩ বছৰতহে ইয়াৰ প্ৰভাৱ গোটেই পৃথিৱীতে মানৱ-জীৱনৰ সকলো দিশতে বিস্তাৰিত হৈ পৰিছে। এই চুটি প্ৰৱন্ধত কৃত্ৰিম বুদ্ধিমত্তাৰ এটা চমু আভাস দিয়া হ’ল।

@@@@@@@@@@@

সম্পাদক: পবিত্ৰা বৰঘৰীয়া
www.surajmukhi.org

কৃত্ৰিম বুদ্ধিমত্তা - ১

Recent Posts

Comments