কৃত্ৰিম বুদ্ধিমত্তা - ১
- ড° যুগল কলিতা, ক’লৰাডো, আমেৰিকা

- Jul 13
- 5 min read

ড° যুগল কলিতা, ক’লৰাডো, আমেৰিকা
মানৱজাতিৰ উদ্ভৱ বহু কোটি বছৰৰ জৈৱিক ক্ৰমবিকাশৰ ফলত। অজৈৱ পদাৰ্থৰ পৰাই চাৰি হাজাৰ কোটি বছৰৰ আগতে ভাগ্যক্ৰমে জৈৱিক অণুৰ আৱিৰ্ভাৱ হৈছিল ৰসায়নিক প্ৰক্ৰিয়াৰ ফলস্বৰূপে। এনে জৈৱিক অণুৰ পৰাই কালক্ৰমে এককোষীয় জীৱৰ সৃষ্টি হৈছিল। দীঘলীয়া জৈৱিক ক্ৰমবিকাশৰ শেহতীয়া উদ্ভৱ মানৱ নামৰ প্ৰজাতিৰ ৬০ ৰ পৰা ২০ লাখ বছৰ আগতে।
মানুহ বা মানৱ জাতিক আমি সাধাৰণতে সৰ্ব্বশ্ৰেষ্ঠ জীৱ বুলি মানি লওঁ। কিন্তু কিয়? অন্য বহুত জীৱ-প্ৰজাতিৰ দৰে মানুহৰ পাঁচোটা ইন্দ্ৰিয় আছে -- চকু (দৃষ্টি), কাণ (শ্ৰৱণ), নাক (ঘ্ৰাণ), জিভা (স্বাদ) আৰু ছাল (স্পৰ্শ)। বহু জন্তুৰ ইন্দ্ৰিয় শক্তি মানুহতকৈ বেলেগ বা ভাল। যেনে বাদুলি, শিহু আৰু তিমিমাছে দূৰৰ নেদেখা বস্তুৰ অৱস্থান নিৰ্ণয় কৰিব পাৰে শব্দৰ ঢৌৰ প্ৰতিফলনৰ সহায়ত। মানুহৰ ইন্দ্ৰিয়সমূহ অন্য জীৱৰ ইন্দ্ৰিয়তকৈ বহুগুণে শ্রেষ্ঠ বুলি দাবী কৰিব নোৱাৰি ।
জীৱ-বৃক্ষত মানৱ প্ৰজাতি অন্য জীৱতকৈ উন্নত বুলি দাবী কৰাৰ এটা প্ৰধান কাৰণ ভাষাৰ ব্যৱহাৰ, ভাৱমূলক চিন্তা আৰু যুক্তি শক্তি -- যাক বুদ্ধিমত্তা বুলিও কোৱা হয়। কৃত্ৰিম বুদ্ধিমত্তা (artificial intelligence) বুলি ক'লে যিবিলাক কামত মানুহে সাধাৰণতে পাৰদৰ্শিতা দেখুৱায়, তেনে কাম কেনেকৈ যন্ত্ৰৰ দ্বাৰা সুকলমে কৰাব পাৰি, তাকে বুজোৱা হয়। এনে কাৰ্য্যৰ উদাহৰণ হ'ল -- নজনা কথা বা কাম শিকা, চিন্তাসহিত যুক্তি আৰু কাৰণ দৰ্শাই ভাষাৰ সহায়ত বক্তৱ্য প্ৰকাশ কৰা, নিজৰ স্থানগত পৰিৱেশৰ বিষয়ে জ্ঞান আয়ত্ত্ব কৰা, দৈনন্দিন বা ব্যৱসায়িক জীৱনৰ বিভিন্ন সমস্যাৰ সমাধান কৰা আৰু পৰিস্থিতি সাপেক্ষে প্ৰয়োজনীয় সিদ্ধান্ত লোৱা।

২০১২ ৰ পৰা এতিয়ালৈ যোৱা এক দশকতকৈ সামান্য অধিক এই কালচোৱাক কৃত্ৰিম বুদ্ধিমত্তা বা যান্ত্ৰিক শিক্ষণৰ দিন বুলি বহুতেই অভিহিত কৰিছে। কৃত্ৰিম বুদ্ধিমত্তাৰ দৈনন্দিন ব্যৱহাৰৰ উত্তম ব্যৱহাৰৰ প্ৰদৰ্শনৰ উদাহৰণ কেইটামান হ'ল: গুগল বা মাইক্ৰ'চফ্টৰ সন্ধান যন্ত্ৰ (search engine), ইউটিউব আৰু এমাজনৰ (Amazon) অনুমোদন যন্ত্ৰ (recommendation engine), স্বয়ংচালিত যান-বাহন (যেনে ৱেইম' কোম্পেনীৰ), ডবাখেলৰ দৰে কৌশল পৰিপূৰ্ণ খেলত অতি-মানৱীয় পাৰদৰ্শিতা দৰ্শন আৰু সৃজনীমূলক লিখন- অঙ্কণ- আৰু কলা-প্ৰতিভা।
ছবি ১: ইংৰাজীৰ পৰা অসমীয়ালৈ অনুবাদ

কৃত্ৰিম বুদ্ধিমত্তা বিষয়টোৰ অন্তৰ্গত উপ-বিষয়বোৰৰ মাজত বিশেষ উল্লেখনীয় কেইটামান হ'ল -- যান্ত্ৰিক শিক্ষা (machine learning), যুক্তি প্ৰদৰ্শন (reasoning), জ্ঞানৰ স্পষ্ট বিৱৰণ (knowledge representation), স্বয়ংক্ৰিয় পৰিকল্পনা স্ৰজন (automatic planning), স্বাভাৱিক ভাষা প্ৰক্ৰিয়াকৰণ (natural language processing), যন্ত্ৰমানৱ বিদ্যা (robotics), আৰু পৰিৱেশ সচেতনতা (perception)। কৃত্ৰিম বুদ্ধিমত্তাৰ গৱেষকসকলে বিভিন্ন কাৰিকৰী আৰু বৈজ্ঞানিক পদ্ধতিৰ সহায় লয়। ইয়াৰ ভিতৰত তথ্য সন্ধান প্ৰণালী (search), গাণিতিক অনুকুলন (mathematical optimization), গাণিতিক তৰ্কবিদ্যা, কৃত্ৰিম স্নায়ুকোষীয় জাল (artificial neural networks), পৰিসংখ্যা বিজ্ঞান (statistics), অৰ্থনীতি, ইত্যাদি।
এই চুটি প্ৰৱন্ধত কৃত্ৰিম বুদ্ধিমত্তাৰ দুটা উপ-বিষয়হে সামান্যকৈ উল্লেখ কৰা হব: স্বাভাৱিক ভাষা প্ৰক্ৰিয়াকৰণ আৰু কম্পিউটৰীয় দৃষ্টিশক্তি।
স্বাভাৱিক ভাষা প্ৰক্ৰিয়াকৰণ
কম্পিউটাৰ এটা বিশেষ যন্ত্ৰ। এই যন্ত্ৰৰ লগত যদি মানুহৰ ভাষাত কথিত বা লিখিতভাবে যোগাযোগ কৰাৰ প্ৰচেষ্টাকে স্বাভাৱিক ভাষা প্ৰক্ৰিয়াকৰণ (natural language processing) বুলি কোৱা হয়। কৃত্ৰিম বুদ্ধিমত্তাৰ এই উপ-বিভাগটোৰ ভিতৰত অধ্যয়ণ কৰা বিষয়বোৰৰ মাজত আছে
-- কথিত ভাষা চিনাক্তকৰণ (speech recognition)
— কথিত ভাষা উৎপাদন (speech generation)
— যান্ত্ৰিক অনুবাদ (machine translation),
— তথ্য নিষ্কাশন (information retrieval),
— প্ৰশ্নোত্তৰ (question answering), ইত্যাদি।
যান্ত্ৰিক অনুবাদ
গুগল, মাইক্ৰ'চফ্ট আৰু অ'পেনএআই (OpenAI) আদি কৃত্ৰিম বুদ্ধিমত্তা-যুক্ত ৱেবচাইট বা এপে বিভিন্ন ভাষাত লিখা শব্দ, বাক্য বা নথি-পত্ৰ অন্য ভাষালৈ মুহূৰ্ততে অনুবাদ কৰিব পাৰে কোনো মানুহৰ সহায় নোলোৱাকৈ। ২০২৫ চনৰ জুন মাহত গুগল অনুবাদত ২৪৯টা ভাষা আছে। অৰ্থাৎ ২৪৮ x ২৪৮ = ৬১,৫০৪ যোৰ ভাষাৰ মাজত ই অনুবাদ কৰিবলৈ সক্ষম। মাইক্ৰ'চফ্ট অনুবাদকে ১৮০টা ভাষা জানে, অৰ্থাৎ ১৭৯টা ভাষাৰ লেখা ১৭৯টা অন্য ভাষালৈ অনুবাদ কৰিব পাৰে। কোনো এজন মানুহৰ বাবে ইমানবোৰ ভাষা পাকৈতকৈ জনা আৰু তৎক্ষণাতে অনুবাদ কৰা সম্ভৱ নহয়। এটা বৃহৎ বহুজাতিক কোম্পেনীয়ে বহু হাজাৰ বিদগ্ধ ভাষাবিদক বহু কোটি ডলাৰ ভৰি নিযুক্তি দিলেও, এনে কাম মানুহৰ দ্বাৰা সম্ভৱপৰ নহয়। এনে কামৰ বাবে কৃত্ৰিম বুদ্ধিমত্তাৰ প্ৰয়োজন।

ছবি ২: প্ৰশ্নোত্তৰ, চেটজিপিটি জুন ২৪, ২০২৫
কম্পিউটাৰ যন্ত্ৰৰ ভিতৰত চফ্টৱেৰ কি ধৰণে লিখিব লাগিব, বহু ভাষাৰ পৰা বহু ভাষালৈ তাৎক্ষণিক অনুবাদৰ কাৰণে, এই বিষয়ৰ ওপৰত হাজাৰ-হাজাৰ ভাষাবিদ আৰু কম্পিউটাৰ বিজ্ঞানীয়ে বহু দশক ধৰি গৱেষণা কৰি আহিছে। যোৱা ১০-১২ বছৰতহে গুগল, মাইক্ৰ'চফ্ট আদি কোম্পেনীয়ে বৃহদাকাৰত এনে কাম কৰিবলৈ সক্ষম হৈছে। ২০১৫-১৬ চনলৈকে পৰিসংথ্যা বিজ্ঞানৰ সহায়ত যান্ত্ৰিক অনুবাদৰ বাবে লাগতিয়াল প্ৰণালীবোৰ লিখা হৈছিল। ২০১৬ চনৰ পৰা গুগলে কৃত্ৰিম স্নায়ুকোষীয় জালেৰে যান্ত্ৰিক অনুবাদৰ দিহা কৰি আহিছে। ছবি ১ত গুগল অনুবাদকে ইংৰাজীৰ পৰা অসমীয়ালৈ অনুবাদ কৰা কেইজোৰমান বাক্য দেখুওৱা হৈছে। অনুবাদ ২০২৫ৰ জুনৰ ২১ তাৰিখৰ। সহজ বাক্যৰ অনুবাদ ভালকৈয়ে কৰিব পাৰে যান্ত্ৰিক অনুবাদকবোৰে।

ছবি ৩: কম্পিউটৰীয় দৃষ্টিশক্তি, চেটজিপিটি জুন ২৩, ২০২৫
প্ৰশ্নোত্তৰ
কোনোবাই যদি কাৰোবাক এটা প্ৰশ্ন সোধে, তাৰ উত্তৰ দিবলৈ কিহৰ প্ৰয়োজন? প্ৰথম, কোৱাজন আৰু শুনাজনৰ মাজত বিষয়বস্তুৰ কিছু হ'লেও পাৰস্পৰিক জ্ঞান থাকিব লাগিব। দ্বিতীয়, প্ৰশ্নটো শুনাজনে বুজি পাব লাগিব -- অৰ্থাৎ প্ৰশ্নটো সোঁধোতাজনে এটা ভাষাৰ মাধ্যমেৰে অস্পষ্টতা বা দ্ব্যৰ্থতা নথকাকৈ সুধিব লাগিব। তৃতীয়, শুনাজনে নিজৰ ভাষাৰ জ্ঞানেৰে প্ৰশ্নটো বুজি পাব লাগিব। চাৰি, উত্তৰ দিওঁতাজনে বহু কথা জানে -- কিজানি বহু লাখ কথা জানে -- এইবোৰ কথাৰ মাজৰ পৰা লাগতিয়াল তথ্যখিনি অতি সোনকালে বাচি নিষ্কাশন কৰি উলিয়াব লাগিব। পাঁচ, উলিওৱা তথ্যবোৰ যুগুতাই ভাষাৰ মাধ্যমেৰে প্ৰকাশ কৰিব লাগিব যাতে সোধাজনে বুজি পায় আৰু সোধাজনৰ উদ্দেশ্য সিদ্ধি হয়। ওপৰত বৰ্ণোৱা কামখিনি মানুহে কোনো বিশেষ পুংখানুপুংখ স্পষ্ট প্ৰণালীৰে সাধাৰণতে নকৰে -- প্ৰণালীটোৰ বিষয়ে বহুল চিন্তা নকৰাকৈয়ে সচৰাচৰ উত্তৰ দিবলৈ সক্ষম হয় উত্তৰ দিওঁতাজনে। যদি এটা যন্ত্ৰই লাখ-লাখ মানুহৰ লাখ-কোটি প্ৰশ্ন কেইবা শ ভাষাত শুদ্ধকৈ আৰু অবিলম্বে দিবলৈ সক্ষম হয়, তেনে এটা চফ্টৱেৰ চালিত যন্ত্ৰ কি ধৰণে নিৰ্ম্মাণ কৰিব লাগিব, সেইটো কৃত্ৰিম বুদ্ধিমত্তাৰ বিজ্ঞানী আৰু অভিযন্তাসকলৰ গৱেষণাৰ বিষয়বস্তু। কি ধৰণে এনে বিশাল কাম সমাধা কৰা হয়, সেই আলোচনা এই প্ৰৱন্ধত বিশদভাবে কৰা সম্ভৱ নহয়। ভাষাবোৰৰ সাধাৰণ জ্ঞান আৰু লগতে কেইবালাখ প্ৰশ্ন আৰু সেই প্ৰশ্নবোৰৰ শুদ্ধ উত্তৰৰ এটা নমুনা-সংগ্ৰহৰ (dataset) প্ৰয়োজন যান্ত্ৰিক শিক্ষণৰ এটা যন্ত্ৰক প্ৰশিক্ষণ (training) দিয়াবলৈ। চেটজিপিটিৰ দৰে বৃহৎ কৃত্ৰিম স্নায়ুকোষীয় জালক বৃহদাকাৰ প্ৰশ্নোত্তৰ নমুনা-সংগ্ৰহৰ সহায়ত প্ৰশিক্ষন দিয়া হয়। চেটজিপিটিৰ লগত ২০২৫ৰ জুনৰ ২২ তাৰিখে হোৱা হোৱা এটা চমু প্ৰশ্নোত্তৰ বৈঠক ছবি ২ত দিয়া হ'ল।
কম্পিউটৰীয় দৃষ্টিশক্তি
আগতে উনুকিওৱা হৈছে যে চকু এটা মানৱীয় ইন্দ্ৰিয়। যেতিয়া মানুহে এটা বস্তু দেখে, প্ৰথমে সেই বস্তুৰ লগত জড়িত পোহৰৰ ৰশ্মিবোৰ চকুৰ ফলক-কাঁচত (lens) পৰে। এই ৰশ্মিবোৰ ফলক কাঁচৰ মাজেদি গৈ চকুৰ পিচফালে থকা আলোকীয় স্নায়ুগোটত (optical nerves) পৰে। তাৰ পিচত স্নায়ুকোষৰ দীঘলীয়া শৃংখলেৰে গৈ মস্তিস্কৰ পিচফালে থকা আলোকীয় স্নায়ুকেন্দ্ৰ (optical cortex) পায় — ইয়াতে এতিয়াও ভালকৈ নুবুজা প্ৰক্ৰিয়াৰ অন্তত মানুহৰ মস্তিস্কই চকুৰে কি দেখিলে সেইটো বুজি পায়।
মানুহে চকুৰে দেখি বিভিন্ন বস্তু চিনি পোৱাৰ দৰে কম্পিউটাৰকো শিকাব পাৰি দেখা বস্তু চিহ্নিত কৰিবলৈ। ইয়াকে কম্পিউটৰীয় দৃষ্টি বুলি কোৱা হয়। যোৱা পাঁচ দশকৰো অধিক কম্পিউটাৰ বিজ্ঞানীসকলে এই বিষয়ত গৱেষণা কৰি আছে। এই প্ৰৱন্ধত এই বিষয়ে দীঘলীয়াকৈ লিখাৰ অৱকাশ নহ'ব। কম্পিউটাৰ চফ্টৱেৰক ছবি বা আলোকচিত্ৰত থকা বস্তুবোৰ চিনাক্তকৰণত শিক্ষা দিবলৈ চিত্ৰ সংগ্ৰহৰ (dataset) প্ৰয়োজন। প্ৰত্যেকখন ছবি বা আলোকচিত্ৰৰ লগত এটা চিহ্ন-নাম (label) থাকে। কৃত্ৰিম স্নায়ুকোষীয় জালৰ সহায়েৰে কম্পিউটাৰে শিকি ল'ব পাৰে কোনটো বস্তুত থকা কি ঠাঁচবোৰ সেই বস্তুৰ পৰিচায়ক। তদুপৰি আজিকালি বৃহৎ বহুজাতিক কোম্পেনীবোৰে আগতীয়াকৈ প্ৰশিক্ষণ দিয়া বৃহদাকাৰ ভাষা চানেকীবোৰে (large language model) দেখা বস্তুবোৰৰ এটা বিৱৰণো দিব পাৰে। এনে এটা চেটজিপিটি-সৃষ্ট বিৱৰণ ছবি ৩ ত দিয়া হ’ল।
সমাপ্তি
কৃত্ৰিম বুদ্ধিমত্তা এটা বিশাল আৰু জীৱন্ত বিষয়। এই বিষয়ত বহুল গৱেষণা দেশে-বিদেশে, বিশেষকৈ আমেৰিকা আৰু চীনদেশত হৈ আছে। কৃত্ৰিম বুদ্ধিমত্তাৰ “যুগ” ২০১০ দশকৰ পৰা আৰম্ভ হ’লেও যোৱা ২-৩ বছৰতহে ইয়াৰ প্ৰভাৱ গোটেই পৃথিৱীতে মানৱ-জীৱনৰ সকলো দিশতে বিস্তাৰিত হৈ পৰিছে। এই চুটি প্ৰৱন্ধত কৃত্ৰিম বুদ্ধিমত্তাৰ এটা চমু আভাস দিয়া হ’ল।
@@@@@@@@@@@





Comments