গুরুচণ্ডা৯ : হরিদাস পাল : ভূতের বেগার

যে কোনো ঠিকানায় গুরুচণ্ডা৯র বই পেতে ফোন অথবা হোয়াটসঅ্যাপ করুন +৯১ ৯৩৩০৩ ০৮০৪৩ অথবা +৯১ ৮৭৭৭৬ ৪২২৩৪ নম্বরে

হরিদাস পাল ব্লগ
ভূতের বেগার
Arindam Basu লেখকের গ্রাহক হোন
ব্লগ | ১১ ডিসেম্বর ২০২৩ | ১৭০১ বার পঠিত | রেটিং ৪ (৫ জন)
পর্ব ১ | পর্ব ২
"You are delivered to the advertiser who is the customer.
He consumes you.
The viewer is not responsible for programming ——
You are the end product"
Richard Serra (1973)

এই সারসত্যটি টেলিভিশনের য়ুগে আজ থেকে ৫০ বছর আগে ১৯৭৩ এ মার্কিন শিল্পী/ভাস্কর রিচার্ড সেরা করেছিলেন ।
তারপর সামাজিক মাধ্যমের যুগ এল।
আমরা, যেখানে, সেখানেই রয়ে গেলাম, পণ্যে পরিবর্তিত হলাম।
সে একরকম চলছিল।
এখন কৃত্রিম বুদ্ধিমত্তার যুগ |
যন্ত্রকে চোখ, কান দিয়ে শেখানোর আমল।
রোবটেরা আসছে, এখনো আসেনি।
এযুগের বহিঃপ্রকাশ আরো উদগ্র, আরো ভয়ঙ্কর।
একদল মানুষ ভূতের বেগার খেটে চলেছে দিবারাত্র, কে জানে আপনিও হয়ত তাদেরই একজন, হয়ত নন। হয়ত জেনে শুনে ভূতের বেগার খাটছেন, হয়ত অজান্তে।

বিপন্ন সময়ে এই অদ্ভুত জীবন আর টেকনোলজির বিচিত্র জগতের সঙ্গে একটু পরিচয় হোক।

***

লেখাটির দ্বিতীয় পর্ব শুরু করার আগে যারা এই লেখাটিতে কমেন্ট করেছেন তাঁদের কাছে কৃতজ্ঞতা জানিয়ে রাখি।

যে কারণে লেখাটা শুরু করা সেটা মানুষে মেশিনে এক ধরণের অদ্ভুত ধরণের ঠিকে কাজের বন্দোবস্ত হয়েছে, যেখানে মানুষকে নিয়ন্ত্রণ করে মেশিন, এবং অদ্ভুত নৈর্বক্তিক সব ব্যাপার স্যাপার, যেখানে মানুষ না হলে মেশিন হয় না, আবার সেই মেশিনই কাজ শেষ হলে মানুষের কাজ নিয়ে নেয়। ব্যাপারটার মধ্যে এক অদ্ভুর ধরণের বৈপরীত্য রয়েছে, মানুষ বিশেষে এবং পরিস্থিতি বিশেষে ব্যাপারটা মর্মান্তিক। পুরো বিষয়টার একটা নৈতিক দিক, বিশেষ করে একটা নেতিবাচক নৈতিক দিক রয়েছে, যা নিয়ে আলোচনা চলতে পারে। কিছুটা সেই আলোচনা উস্কে দেবার জন্যও এই লেখাটার সূত্রপাত। এখানে যে কথাটা বিশেষ করে লেখার, মানুষকে বাদ দিলে মেশিন অচল, বিশেষ করে কৃত্রিম বুদ্ধিমত্তা (আর্টিফিশিয়াল intelligence)-র ক্ষেত্রে একেবারেই অচল, সেই প্রসঙ্গে আসছি। মনে হওয়া খুবই স্বাভাবিক আর্টিফিশিয়াল ইনটেলিজেনসের যুগে মানুষের কাজ মেশিনে নিয়ে নেবে, কিন্তু কার্যক্ষেত্রে তা হয়ত হবে না, কে জানে হয়ত আমাদের কাজের জগতের বা নটা-পাঁচটার প্রথাগত কাজের জায়গাটিতে একটা পরিবর্তন আসতে চলেছে।

আসছি সে কথায়, তার আগে কৃবু, মানে কৃত্রিম বুদ্ধিমত্তা (Artificial Intelligence/Machine Learning) নিয়ে দু-চার কথা লেখা যাক। কোথা থেকে শুরু করা যায়? যোষিতার ভ্যাকুম ক্লিনার (“ভ্যাক”) দিয়েই না হয় গল্পটা শুরু করা যাক।
যোষিতার একটি রোবট চালিত রোবটিয় যন্তর আছে, যোষিতা বলে,
> নিজেই সময়মত নেমে এসে ঘর দোর পরিষ্কার করে নিজের চার্জিং স্টেশনে গিয়ে বসে থাকে। অল্প কথাও বলে।
ওর সেনসর সমস্ত ধুলোবালি খুঁজে খুঁজে টেনে নেয়।

স্বয়ংক্রিয় যন্ত্র।
সেটা না হলে, এই ভ্যাককে নিজে টেনে নিয়ে সব জায়গায় পরিষ্কার করার কাজ নিজেকে করতে হয়, সে ভারি পরিশ্রমসাধ্য কাজ। এখানে মানুষ আর যন্ত্রের এক জায়গায় মিল রয়েছে, উভয়েই “চোখ” দিয়ে দেখে কোথায় ধুলোময়লা, কোন জায়গাটা কার্পেট, কোন জায়গায় সিঁড়ি শুরু হয়েছে, কোথায় দেওয়াল, মানে আপনি চোখ-কান বন্ধ করে সাধারণ একটি ভ্যাক দিয়ে ঘর পরিষ্কার করতে গেলে ঠিক করে উঠতে পারবেন না, আপনাকে কোন না কোন রকম “দৃষ্টি”নির্ভর কাজ করতে হবে।

আর রোবোট ভ্যাক?

“Infrared lasers are used by more expensive robot vacuum cleaners to assess the size and shape of a room, while cheaper models rely on physical boundary stripes that you must place on the floor to ensure the robots only cleans in a specific area. “
(https://www.techradar.com/news/how-do-robot-vacuums-work-and-should-i-buy-one)

Robotic vacuum cleaners don't use cameras to see the world. Instead, they use various types of sensors to detect and measure the worlds around them and their own progress through it, including cliff sensors, bump sensors, wall sensors and optical encoders.
…
Optical encoders are the most important: these sensors on the wheels of the robot tell it how far it has gone. They are called optical encoders because they use a light sensor to detect how many times the wheels have rotated. From this (and any difference between wheels, which indicates a turn), the robot can figure out how far it has traveled. Different models may include additional sensors (such as a dust scanner to see how much dust is being picked up), but those are the basic sensors that all robotic vacuums include.
(https://www.cnet.com/home/kitchen-and-household/appliance-science-how-robotic-vacuums-navigate/)

এই যে বিভিন্ন ধরণের সেনসর, অপটিকাল “এনকোডার”, লাইট সেনসর, বিভিন্ন ধরণের সংবেদনকে গ্রহণ এবং তাদের বিশ্লেষণ, যা না হলে যন্ত্রটাই হয না, সে সমস্ত কাজ মানুষের। মানুষ ব্যতিরেকে শুধু “কম্পিউটারের” কাজ নয় (যদিও unsupervised learning এর একটা ভূমিকা থাকে)। মানুষ “শেখায়” কম্পিউটারকে কিভাবে দেখতে হয়, কিভাবে “শুনতে হয়”, কিভাবে “ভাবতে হয়”। যে ব্যাপারটি এখানে সবিশেষ উল্লেখযোগ্য, মেশিনকে “শেখানোর” নেপথ্যে শুধু বৈজ্ঞানিকরাই বা যাঁরা কোড লেখেন, প্রোগ্রামিং করেন তাঁরাই নন, একটা বিশাল ভূমিকা গ্রহণ করেন যাঁরা “লেবেলিং” এর কাজ করেন।

ধরুণ আপনি মেশিনকে শেখাতে চান কি করে কুকুর আর বেড়াল চিনতে হয়। এইখানে ছোট শিশুকে কুকুর বেড়াল চেনানো আর মেশিনকে কুকুর বেড়াল চেনানোয় একটা মস্ত ফারাক। মানুষের শিশুকে শেখাতে গেলে কয়েকটা ছবি, বড়জোর একটা কুকুর আর একটা বেড়ালের সঙ্গে পরিচয় করিয়ে দিলেই সে মোটামুটি পরের বার বেশ শিখে যাবে কোনটাকে কি বলতে হয়। মেশিন তো আর সেটা পারে না, তাকে “শেখাতে” গেলে বিস্তর চিন্তা ভাবনার ব্যাপার রয়েছে। ধরুন আপনি মনে করলেন হুঁ, কুকুরের লম্বাটে মুখ, বড় চোখ, তেকোণা কান এইসমস্ত “ফিচার” দিয়ে মেশিনকে শেখাবেন কি করে কুকুর চিনতে হয়, এবং তারপর তাকে কুকুরের ছবি দেখালে সে হয়ত শনাক্ত করতে পারবে। সেটা যে সবসময় হবে তা তো নয়। বেশীর ভাগ ক্ষেত্রে হয়ত হবেই না। তার থেকে আরো উন্নত উপায় আমাদের মস্তিষ্কের কোষে আমরা যেভাবে ভাবি, কোষ থেকে কোষে তরঙ্গায়িত হয়ে অজস্র জালের মধ্যে সংকেত পরিবাহিত হয়, সেইভাবে যদি মেশিনকে শেখানো যায়। আমাদের মস্তিষ্কে প্রায় ৮০০০ কোটি মস্তিষ্কের কোষ এবং অযুত জালিকায় চিন্তা-ভাবনা-তরঙ্গের নিরন্তর বাহিত হয়ে চলেছে, এইরকম একটা মডেল বানানো, যেখানে কোষ থেকে কোষে যেমন আমাদের মস্তিষ্কে চিন্তা-চেতনা-তরঙ্গের চলাফেরা, তেমনই মেশিনকে “শেখানোর” ব্যাপারটি ঐভাবে করা যেতে পারে (চিত্র ১)

চিত্রটির ওপরের প্যানেলে দুটো স্নায়ু কোষকে দেখা যাচ্ছে, যাদের একপ্রান্ত থেকে অন্য প্রান্তে সংবেদনা পারাপার করা হচ্ছে, কোষের মাথার দিক (যে জায়গাটিতে লাল চিহ্ন দেখা যাচ্ছে), সেখান থেকে সংবেনদার তরঙ্গ বাহিত হচ্ছে axon নামের অংশটির মাধ্যমে, তারপর দুটি কোষের মাঝের অংশটি (যার নাম সাইন্যাপস), তার মাধ্যমে সংবেদনা এক কোষ থেকে অন্যত্র ধাবিত হচ্ছে।
এর ঠিক নীচে Deep Learning এর ছবি। বাঁদিকের তিনটে নীল রঙের গোলাকার বৃত্ত থেকে তথ্যের সূত্রপাত, তীরচিহ্ন গুলোকে ধরা যাক সাইন্যাপস, মাধের লাল রঙের বৃত্তগুলোকে মনে করা যাক আরো কিছু নিউরন (পরিভাষায় hidden nodes), এবং শেষের output node আরেকটি স্নায়ুকোষ। এবং এইভাবে অজস্র স্নায়ুকোষ একে অপরের সঙ্গে মিলে তথ্যের আদানপ্রদানের বাস্তবায়ন।

এর সঙ্গে লেবেলিং/শনাক্তকরণের আর মানুষে মেশিনে ভুতের বেগারের যে প্রসঙ্গ নিয়ে শুরু করেছিলাম, তার কি সম্পর্ক? আসছি সে কথায় এর পর |

তৃতীয় পর্ব: মেকানিকাল টার্ক
---------

যে বিষয়টি নিয়ে লেখা শুরু করেছিলাম, তাতে ফেরা যাক।

মানুষ মানুষের হয়ে কাজ করেন, সে একরকম, কিন্তু মানুষ যখন যন্ত্রের দাসত্ব স্বীকার করেন, সে এক অন্যরকমের পরিস্থিতি। অথচ মেশিন লার্নিং এবং তথাকথিত "কৃত্রিম বুদ্ধিমত্তার" যুগে এমন একটি বিচিত্র পরিস্থিতি উপস্থিত হয়েছে, যেখানে আমাদের কাজের ধরণ ধারণ হয়ত অনেকটা পাল্টাতে চলেছে, অন্তত কিছু মানুষের ক্ষেত্রে তো বটেই। সেইটা নিয়ে আলোচনা করতে গিযে কিছুটা মেশিন/ডিপ লার্নিং এর অবতারণা করেছিলাম, ওপরের ছবিটায় স্নায়ু থেকে স্নায়ু কোষে সংবেদনা কিভাবে "হস্তান্তরিত" হয় তার একটা রেখাচিত্র এঁকেছি অপটু হাতে। এটার উদ্দেশ্য অবশ্য এ কথা বলা নয় যে আমাদের মস্তিষ্কে ঐভাবেই "ইনফরমেশন" এক স্নায়ু থেকে অন্যত্র ধাবিত হয়। এটা নেহাতই একটা অতি সরলীকরণ, কেউ কি সত্যি জানেন যে মানুষের মস্তিষ্কে ঠিক কিভাবে চেতনা আর তথ্যের প্রকাশ ঘটে? মনে হয় না।

সে যাই হোক, মেশিন এবং ডিপ লার্নিং (আরো বড় করে, ধরা যাক, "কৃ্ত্রিম বুদ্ধিমত্তা") কে কেন্দ্র করে (মূলত, তবে সেটাই একমাত্র নয়), একধরণের "ঠিকে কাজের" সংস্কৃতি গড়ে উঠেছে যাকে কেন্দ্র করে এই লেখা।

এখন যে এ আই (আরটিফিশিয়াল ইনটেলিজেনস), বা বাংলায় বলা যাক কৃবু'র রমরমা, তার পেছনে কমপিউটারের "ছবি চেনা" বা "দৃষ্টি"র একটি অবদান রয়েছে। সে কিরকম? মনে করুন, আপনি একটি ফুলের ছবি তুলেছেন অথচ সে ফুলের নাম আপনার মনে পড়ছে না বা সে নাম আপনি জানেন না। আপনি যদি সেই ফুলটির ডিজিটাল ছবি কমপিউটারে কোন একটি ঐরকম অ্যাপলিকেশনে "তুলে দেন" এবং ফুলটির নাম জানতে চান, কমপিউটার প্রোগ্রাম বা অ্যাপলিকেশনটি সেই ফুলের নাম আপনাকে জানিয়ে দেবে। বা, ধরুন যেভাবে আমরা গুগলে ছবি আপলোড করে সেই ছবির সম্বন্ধে জানতে পারি বা টিন আই নামের সার্চ ইঞ্জিন ব্যবহার করে ছবি সম্বন্ধে জানতে পারি।

তার মানে কমপিউটার কি সে ছবি "দেখতে পেল"? ভেবে দেখলে সেইরকমই তো মনে হয়। এর অন্য নাম 'কম্পিউটার ভিশন"। কমপিউটারকে নানান জিনিস দেখানোর প্রচেষ্টা বহু প্রাচীন। ১৯৯৪ সালে আমেরিকার ডাক বিভাগ একদল কমপিউটার বৈজ্ঞানিকের সঙ্গে মিলে এমন একটি সিস্টেম তৈরী করে যেখানে লোকের হাতের লেখা থেকে তাদের বাড়ির বা ঠিকানার একটা অংশ পড়া যেতে পারে (ওদের দেশের পোস্টাল কোড)।
তো এইরকম।

২০০৬ সাল। স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের এক কমপিউটার গবেষিকা ফাই ফাই লি, তিনি স্থির করলেন জগতে যত রকমের বস্তু আছে, ফুল লতা পাতা, প্রাণী, প্রাকৃতিক দৃশ্যাবলী, ইত্যাদির ছবি তুলে সেগুলো কমপিউটারকে "শেখাবেন"। এই মর্মে তিনি প্রায় ১২ লক্ষ ছবি তুললেন। ১২ লক্ষ ছবির ১০০০ শ্রেণী, প্রতিটি শ্রেণীতে একেকটি ছবির নাম বা পরিচয, শ্রেণীপ্রতি ১২০০ করে ছবি।

এবার কমপিউটারকে "শেখাতে" গেলে যে কাজটা করতে হবে সেটা কিছুটা এইরকম। ধরুন কমপিউটারকে আপনি গোলাপ ফুল যে গোলাপ ফুল সেইটা শেখাতে চাইছেন। প্রথমে গোলাপ এবং অন্যান্য ফুলের ডিজিটাল ছবি সংগ্রহ করলেন (প্রচুর ছবি নানান ভাবে নানান রকমের গোলাপ ফুলের ছবি এবং অন্যান্য ফুল গোলাপ নয় এমন ফুল তাদের ছবি), তারপর সে ডিজিটাল ছবি একটি ডাটাবেসে আপলোড করলেন। তারপর আপনাকে প্রতিটি ফুল যে গোলাপ সে কথাটা কমপিউটারকে জানাতে হবে, সেটি করতে গেলে ফুলের ছবিটিকে "লেবেল" করতে হবে। একই সঙ্গে আপনাকে আরো কিছু ফুল, যে ফুল গোলাপ নয়, তাদের ছবি তুলে এবং লেবেল করে একই রকম করে আপলোড করে দিতে হবে এবং কোনটা গোলাপ ফুল আর কোনটা গোলাপ নয় স্পষ্ট করে কমপিউটারকে শিখিয়ে দিতে হবে। তার পরে আরো কিছু জটিল অঙ্কের ব্যাপার রয়েছে।

২০০৬ সালে যন্ত্রকে যাবতীয় জাগতিক ছবি চেনানোর এই জটিল কাজটি সম্পন্ন করার উদ্দশ্যে ফাই ফাই লি একটি ডাটাবেস তৈরী করলেন,তার নাম দিলেন  ইমেজনেট। পরবর্তীকালে ইমেজনেটকে কেন্দ্র করে যন্ত্রকে ছবি চেনানোর বহু প্রতিযোগিতা হয়েছিল এবং  কৃবুর জগতে ইমেজনেটের অপরিসীম গুরুত্ব, কত যে আবিষ্কার ইমেজনেটের মাধ্যমে হয়েছে! আপাতত সে গল্প থাক। কাজের কথায় ফিরি।

১২ লক্ষ ছবি তো ফাই ফাই লি তুললেন, অত ছবির লেবেল হবে কি উপায়ে? ফাই ফাই একা যদি সবকটি ছবির লেবেলের দায়িত্ব নিয়ে লেবেল করতেন এবং সারা দিন শুধু লেবেল ছাড়া আর অন্য কোন কাজ না করতেন, তাহলেও তাঁর একার পক্ষে সব ছবি লেবেল করতে কমপক্ষে ১০-১২ বছর লেগে যেত। কাজেই অন্য উপায় অবলম্বন করতেই হয়।
সময়টা ২০০৬, তখনও আজকালকার সাবেক তথাকথিত সামাজিক মাধ্যম বাজারে আসেনি।

তখন ফাই-ফাই লি আমাজন কোমপানীর মেকানিকাল টার্কের (এমটার্ক) শরণাপন্ন হলেন।

সেই সময়ে কোম্পানি হিসেবে আমাজন আজকের তুলনায় অপেক্ষাকৃত ক্ষুদ্রায়তন। আমাজন শুরু হয়েছিল নানারকমের বইয়ের ডিজিটাল ক্যাটালগ এবং বিক্রির মাধ্যম রূপে। তার পর কালক্রমে সেখানে অন্যান্য বহু বিক্রেতা নিজেদের পণ্য নিয়ে পসার শুরু করলেন,ফলে আমাজন একটি বৃহদাকার ডিজিটাল বাজারে পরিণত হল।
এযাবৎকাল মানুষ বই বাড়ি, গাড়ি নানারকমের সামগ্রী এই সমস্ত ক্রয় বিক্রয় করে এসেছে, ডিজিটাল জগতেও তার ব্যতিক্রম হয় নি। আমাজন ইন্টারনেটে অবস্থিত একটি বৃহৎ বিপণি, সেখানে কি না বিক্রি হয়।  আমাজনের বাজার যখন জমে উঠেছে তখন আরেকটি জটিল সমস্যা দেখা দিল। বিপণিটি নিঃসন্দেহে অতিবৃহৎ, সবাই বেচতে চায়, অতএব এক্ষেত্রে যা হয়, প্রচুর পরিমাণে একই বস্তুর অজস্র ডুপ্লিকেট বেরোতে লাগল। এখন মানুষের চোখে একেক জোড়া জিনিস যে ডুপ্লিকেট, সেটি নির্ণয় করা সহজ, যন্ত্রের দ্বারা সেই কাজ সম্পন্ন হবার নয় (অন্তত সে সময়ে সম্ভব ছিল না)। দু দশ হাজার ডুপ্লিকেট ছবি না হয় মানুষজন চোখে দেখে নির্ণয় করতে পারেন এক্ষেত্রে সমস্যা হল যে লক্ষ লক্ষ জিনিসের ডুপ্লিকেট, কোন বেশ কয়েকজন মানুষের পক্ষেও করে ওঠা সম্ভব নয়, অথচ না করতে পারলে ব্যবসাটাই অচল হয়ে পড়ে। এ সেই ফাই-ফাই লি'র ছবি চেনার আর লেবেলিং এর সমস্যার মতন ব্যাপার।

এর সমাধান করলেন হরিনারায়ণ নামে এক ভারতীয় ইঞ্জিনিয়র,যাকে বলে যন্ত্রে-মানুষে মেলবন্ধন ঘটিয়ে। ডুপ্লিকেট ছবি চেনার কাজটিকে যন্ত্রের সাহায্যে অসংখ্য ছোট ছোট অংশে ভাগ করে ফেলা হল, তারপর একেকটা ছোট অংশ অজস্র মানুষের মধ্যে ইন্টারনেটের মাধ্যমে ছড়িয়ে দেওয়া হল। এতে করে, যে যার নিজের সময়মত কাজটুকু করে জমা দিলেন, কাজটা সময়মত হয়ে গেল। এরা এর নাম দিলেন এম টার্ক, ইউরোপের অষ্টাদশ শতকে মেকানিকাল টার্কের নামের আদলে।

আমাজনের মালিক জেফ বেজোস ঝানু ব্যবসায়ী। তিনি দেখলেন, এ ব্যাপারটিকে যদি বাজারে নিয়ে আসা যায়, বা যেভাবে মানুষ বাজারে এসে পসার সাজিয়ে বিক্রিবাটা করে, ঠিক সেভাবেই এই প্রক্রিয়াটিকে কেন্দ্র করে যদি একটি 'কাজের বাজার' তৈরী করে ফেলা যায়, কেমন হয়?

ব্যাপারটা কেমন জানেন? মনে করুন আপনি একটি প্রবন্ধ লিখছেন, সে প্রবন্ধের জন্য কিছু তথ্য ও গবেষণার প্রয়োজন, আপনার হাতে সময় নেই। আপনি আমাজনের এম টার্ক নামে প্রোজেক্টটিতে নাম লেখালেন গবেষণার কাজটি সম্পন্ন করার জন্য বিজ্ঞাপণ দিলেন এবং বললেন যে আপনার কয়েকটি গবেষণালব্ধ প্রবন্ধ চাই ও প্রবন্ধ পিছু আপনি যে কাজ করে দেবে তাকে টাকা দেবেন। এবার মনে করুন, আমিও এমটার্কে নাম লিখিয়েছি, তবে আমি কাজ "দেব" বলে নাম লেখাইনি, কাজ "চাই" বলে নাম লিখিয়েছি। আপনার বিজ্ঞাপণটি আমার নজরে পড়ল, আমি কাজ "ধরে" নিলাম। আপনি তথ্য চাইছিলেন আমি তথ্য সংগ্রহ করে এমটার্কের মাধ্যমে আপনার কাছে পাঠালাম, আপনি আমাকে যে পারিশ্রমিক দেবেন প্রতিশ্রুতি করেছিলেন, এমটারকের মাধ্যমে পাঠিয়ে দিলেন। এ বাবদ আমাজন এমটার্ক তাদের ধার্য টাকা কেটে নিয়ে আমাকে আমার পারিশ্রমিক মিটিয়ে দিল।

আপনি আমাকে চেনেন না, আমিও আপনার সঙ্গে পরিচিত হলাম না, আমার আর আপনার সম্পর্ক কাজ নিয়ে, তাও পুরো কাজটুকু নয় কাজের কিয়দংশ মাত্র। আমার কাজ করা হয়ে গেলে টাকা পেয়ে আমি আবার অন্য কাজ "ধরলাম", আপনিও অন্যত্র চলে গেলেন, আমাদের কেউ কাউকে চিনি না, তার প্রয়োজনও নেই এ কাজে। আপনার কাছে আমি অদৃশ্য, আমার কাছে আপনি অদৃশ্য, মাঝখানে রয়ে গেল যন্ত্র।

যন্ত্র, মানুষকে নিয়ন্ত্রণ করল।

মেকানিকাল টার্ক। যান্ত্রিক তুর্কী।

ইউরোপে অষ্টাদশ শতকে, ১৭৭০ সালে উলফগ্যাং ফন কেমপেলেন নামে এক হাঙ্গেরিয়ান উদ্ভাবক সে সময়ের অস্ট্রো-হাঙ্গেরিয় সাম্রাজ্যের মহারাণীর জন্য এক যন্ত্রের আবিষ্কার করেন, তার নাম দেন মেকানিকাল (যান্ত্রিক) টার্ক (তুর্কী?)। অদ্ভুত এই যন্ত্রের ভেতরে একজন মানুষ থাকত, যে লোক ওস্তাদ দাবাড়ু, কিন্তু সে থাকত লোকচক্ষের অন্তরালে। লোকে দেখত যান্ত্রিক এক পুতুল, যাকে দেখতে তু্র্কী বাজিগরদের মতন, সে অনায়াসে তাবড় দাবাড়ুদের দাবা খেলায় হারিয়ে দিচ্ছে (চিত্র ২)

(কেমপেলেনের যান্ত্রিক তুর্কী, মেকানিকাল টার্ক,

যন্ত্রের এহেন খেলা দেখে মানুষ মাত হলেও আসলে পুরো ব্যাপারটি একটি মহা ধাপ্পা, প্রতারণা।

এই আশ্চর্য যান্ত্রিক তুরকীর কার্যকলাপ দেখার পর মার্কিন সাহিত্যিক, যিনি একাধারে গোয়েন্দা গল্পের জনকও বটে,  এডগার অ্যালান পো, "মেলজেলের দাবাড়ু" (maelzel's chess player) নাম দিয়ে একটি প্রবন্ধ লিখেছিলেন। আমি লেখাটি থেকে কিছু কিছু অংশ তুলে দিলাম।

> "we find every where men of mechanical genius, of great general acuteness, and discriminative understanding, who make no scruple in pronouncing the Automaton a pure machine, unconnected with human agency in its movements, and consequently, beyond all comparison, the most astonishing of the inventions of mankind. And such it would undoubtedly be, were they right in their supposition. ... what shall we think of the calculating machine of Mr. Babbage? What shall we think of an engine of wood and metal which can not only compute astronomical and navigation tables to any given extent, but render the exactitude of its operations mathematically certain through its power of correcting its possible errors? What shall we think of a machine which can not only accomplish all this, but actually print off its elaborate results, when obtained, without the slightest intervention of the intellect of man? ...  a machine such as we have described is altogether above comparison with the Chess-Player of Maelzel. By no means — it is altogether beneath it — that is to say provided we assume (what should never for a moment be assumed) that the Chess-Player is a pure machine, and performs its operations without any immediate human agency. Arithmetical or algebraical calculations are, from their very nature, fixed and determinate. Certain data being given, certain results necessarily and inevitably follow. These results have dependence upon nothing, and are influenced by nothing but the data originally given. And the question to be solved proceeds, or should proceed, to its final determination, by a succession of unerring steps liable to no change, and subject to no modification. This being the case, we can without difficulty conceive the possibility of so arranging a piece of mechanism, that upon starting it in accordance with the data of the question to be solved, it should continue its movements regularly, progressively, and undeviatingly towards the required solution, since these movements, however complex, are never imagined to be otherwise than finite and determinate. But the case is widely different with the Chess-Player. With him there is no determinate progression. No one move in chess necessarily follows upon any one other. From no particular disposition of the men at one period of a game can we predicate their disposition at a different period. ... There is then no analogy whatever between the operations of the Chess-Player, and those of the calculating machine of Mr. Babbage, and if we choose to call the former a pure machine we must be prepared to admit that it is, beyond all comparison, the most wonderful of the inventions of mankind. ... It is quite certain that the operations of the Automaton are regulated by mind, and by nothing else. Indeed this matter is susceptible of a mathematical demonstration, a priori. The only question then is of the manner in which human agency is brought to bear. (শেষের লাইনটা আমার দাগানো )।

আমরা পরে আলোচনা করব যে পো'র প্রণীত যান্ত্রিক তুর্কীর এই লেখাটি আমাদের আজকের যুগে তথাকথিত কৃত্রিম বুদ্ধিমত্তার আমলে কি সাংঘাতিক রকমের প্রযোজ্য এবং কি করুণ সে সব কাহিনি। সে গল্প এর পর।
পুনঃপ্রকাশ সম্পর্কিত নীতিঃ এই লেখাটি ছাপা, ডিজিটাল, দৃশ্য, শ্রাব্য, বা অন্য যেকোনো মাধ্যমে আংশিক বা সম্পূর্ণ ভাবে প্রতিলিপিকরণ বা অন্যত্র প্রকাশের জন্য গুরুচণ্ডা৯র অনুমতি বাধ্যতামূলক। লেখক চাইলে অন্যত্র প্রকাশ করতে পারেন, সেক্ষেত্রে গুরুচণ্ডা৯র উল্লেখ প্রত্যাশিত।
পর্ব ১ | পর্ব ২

ব্লগ | ১১ ডিসেম্বর ২০২৩ | ১৭০১ বার পঠিত
আরও পড়ুন
ধ্যান কেন বিজ্ঞানের আলোচনার বিষয় হতে পারে তাই নিয়ে দু চার কথা - অরিন
আরও পড়ুন
ধ্যান ও স্নায়ুবিজ্ঞান: তৃতীয় পর্ব - ধ্যান কেন বৈজ্ঞানিক গবেষণার বিষয় - অরিন
আরও পড়ুন
ধ্যান ও স্নায়ুবিজ্ঞান - দ্বিতীয় পর্ব: বিজ্ঞানের সন্ধানে পাঁচটি চরিত্র - অরিন
আরও পড়ুন
ধ্যান ও স্নায়ুবিজ্ঞান - অরিন
আরও পড়ুন
নিঃসঙ্গ মৃত্যুর পথে ভয়েজার-১, মহাবিশ্বে, মহাকাশে - Arindam Basu
আরও পড়ুন
ভূতের বেগার: দ্বিতীয় অধ্যায় - Arindam Basu
আরও পড়ুন
Typst: সহজে বাংলায় টাইপসেটিং - Arindam Basu
আরও পড়ুন
চেতনার রঙ: শুনব না গান, গান শুনব না, দ্বিতীয় পর্ব - Arindam Basu
আরও পড়ুন
শুনব না গান গান শুনব না - Arindam Basu
আরও পড়ুন
ভূতডাঙার গল্প - Kishore Ghosal
আরও পড়ুন
বৈঠকি আড্ডায় ২০ - হীরেন সিংহরায়
আরও পড়ুন
কিষেণজি মৃত্যু রহস্য - পর্ব ১৭ - বিতনু চট্টোপাধ্যায়
আরও পড়ুন
কিষেণজি মৃত্যু রহস্য - পর্ব ১৬ - বিতনু চট্টোপাধ্যায়
আরও পড়ুন
বিপ্লবের আগুন - পর্ব দশ - কিশোর ঘোষাল
আরও পড়ুন
আমাদের বাবা - Eman Bhasha
আরও পড়ুন
নির্জন পথের পথিক, তপনকর ভট্টাচার্য - Debasis Sarkar
আরও পড়ুন
হস্টেল - Sukdeb Chatterjee
আরও পড়ুন
পরিত্রাণ - Sukdeb Chatterjee
আরও পড়ুন
ভাতা, ভিক্ষা, বামফ্রন্ট এবং নব্য বামপন্থা - Eman Bhasha
আরও পড়ুন
কারফিউ ডাইরি! - sadequzzaman sharif
আরও পড়ুন
দিগ্বিজয় - Tanima Hazra
আরও পড়ুন
তাঁর সিলেট ভ্রমণ! - sadequzzaman sharif
আরও পড়ুন
একটি বুকস্টল ও একটি শহর - Samir Ghosh
আরও পড়ুন
শেষের সেদিন আর ঠিক কতদূরে? - Mani Sankar Biswas
আরও পড়ুন
অথ এনে বেচি কথা - Tanima Hazra
আরও পড়ুন
বৈঠকি আড্ডায় ১৯ - হীরেন সিংহরায়
আরও পড়ুন
দোলজ‍্যোৎস্নায় শুশুনিয়া‌য় - ২২ (সমাপ্ত) - সমরেশ মুখার্জী
আরও পড়ুন
শ্মশান যাত্রীর চিন্তা... - sadequzzaman sharif
আরও পড়ুন
ঔপনিবেশিক হিন্দু আইন : ২ - এলেবেলে
আরও পড়ুন
কিষেণজি মৃত্যু রহস্য - পর্ব ১৯ - বিতনু চট্টোপাধ্যায়
আরও পড়ুন
তোমার বাস কোথা যে...- ১২ - Nirmalya Nag
আরও পড়ুন
বিশ্বভরা প্রাণ - মোহাম্মদ কাজী মামুন
আরও পড়ুন
তোমারে বধিবে যে... - বিপ্লব রহমান
আরও পড়ুন
উঁচু-নীচু জ্যোৎস্না - যদুবাবু
আরও পড়ুন
বাড়ি বৃত্তান্ত - শক্তি দত্ত রায়
আরও পড়ুন
বিবিধার্থ সংগ্রহ ওরফে যা ইচ্ছে বিষয়ে হিজিবিজি বকবক - স্বাতী রায়
আরও পড়ুন
আক্রমণকারী তৈমুরকে কী চোখে দেখতেন হিন্দুস্থানের মোঘল বাদশাহরা : উপল মুখোপাধ্যায় - upal mukhopadhyay

পাতা : ১২

সুদীপ্ত | ৩০ ডিসেম্বর ২০২৩ ১৩:৪৬527283
আচ্ছা এই টইটা মন দিয়ে পড়ছি, বলে গেলাম যাতে অরিন-দা বা dc উৎসাহ না হারান। নীরব পাঠক এমন হয়ত আরও আছে। ভাটে এই বিষয়ে কিছু আলোচনা ছিল, সেটাও কোনো টই-তে রাখলে বেশ হতো।

Arindam Basu | ৩১ ডিসেম্বর ২০২৩ ০০:৩০527291
লেখাটা পড়ার জন্য আন্তরিক ধন্যবাদ জানবেন, সুদীপ্ত।

দ | ৩১ ডিসেম্বর ২০২৩ ১০:৪১527296
আমিও পড়ছি মন দিয়ে। এর মধ্যে কবে যেন কাগজে দেখলাম টেসলার কারখানায় এক রোবট ক্ষেপে গিয়ে মানুষ সহকর্মী পিঠে খামচিয়ে মাংস তুলে নিয়েছে। পড়ে এমন অবাক হলাম এ কি জ্যান্ত সাই ফাই নাকি রে বাবা! ভুতের বেগার খাটতে খাটতে ক্ষেপে গেল? তবে বাংলা কাগজের খবর... তিলকে তালবাগান বানানোই কাজ। আসল খবর আর চেক করা হয় নি।

a | 49.185.164.58 | ৩১ ডিসেম্বর ২০২৩ ১০:৪৯527297
এআই সেফটি নিয়ে রব মাইলসের ইউটিউব চ্যানেল এইখানে

dc | 2401:4900:1cd1:4fe6:5062:5b5b:e18d:ecb0 | ৩১ ডিসেম্বর ২০২৩ ১০:৫৩527298
রোবটকে দিয়ে ভূতের বেগার খাটালে তো খেপে যাবেই!

তবে কিনা ঘটনাটা ২০২১ সালের, কেন জানি এতোদিন পর হঠাত খবরে এসেছে

এই হলো আসল ঘটনাঃ
https://cleantechnica.com/2023/12/28/the-real-shocker-in-the-robot-attacks-tesla-factory-worker-story/

According to a report from The Independent, one out of every 38 auto factory workers gets severe injuries in the US, and Tesla’s gigafactory in Texas was a source of an even worse result — one of of 21 factory workers gets such injuries. That’s a crazy high rate in my eyes — it blew my mind. This is the status of an auto factory worker in 2023? One severe on-the-job injury out of every 38 workers?! Apparently so. And one out of every 21 at Tesla Giga Texas?! That seems wild to me.

Arindam Basu | ০৬ জানুয়ারি ২০২৪ ১৪:৩১527428
যে কারণে যান্ত্রিক তুরকীর প্রসঙ্গটি ঊঠল, ডিপ লার্নিং, ছবি, কম্পিউটারকে ছবি চেনানো, এবং সেই সূত্রে প্রচুর ছবির ও তাকে লেবেলিং এর কারণে ফাই ফাই লি আমাজনের শরণাপন্ন হয়েছিলেন। আমাজন কোমপানি নিজে অবশ্য নিজেদের ব্যবসার কারণে যান্ত্রিক তুর্কীর ব্যবসা খুলেছিল, এবং চটজলদি কিছু অর্থ উপার্জনের আশায় বহু মানুষ নিজে থেকে যেচে যান্ত্রিক তুরকী হয়েছিলেন সে আমলে।
কি বলতে চাইছি বোঝানোর জন্য একটি মামুলি উদাহরণই দিই না হয়।
মনে করুন আপনার কাছে একটা থারমোমিটার আছে, সে থারমোমিটারটিতে শুধু ফারেনহাইট স্কেলে তাপমান পড়তে পারা যায় অথচ আপনি সেলসিয়াস স্কেলে তাপমান মাপতে চান | আপনার থারমোমিটারটির তাপমান মেপে আপনি আপনার কমপিউটারে একটি ফাংশান লিখতে পারেন,

def fahr2celsius(x):
celsius = ((x - 32)/9 ) * 5
return celsius

থারমোমিটারে তাপমান দেখাচ্ছে ১০৪ ডিগ্রী, আপনি আপনার লেখার সৌজন্যে অঙ্ক কষে কমপিউটারে দেখলেন ৪০ ডিগ্রী সেলসিয়াস। এইরকম। এখন আপনি জিজ্ঞাসা করতে পারেন জানা গেল কি করে যে একস থেকে ৩২ বিয়োগ করে নয় দিয়ে ভাগ করে পাঁচ দিয়ে গুণ করতে হবে। আমরা মানুষ, আমাদের প্রারব্ধ অভিজ্ঞতা, পড়াশোনা এরকম নানা সূত্রে আমাদের লব্ধ জ্ঞানের সূত্রে আমরা “মেশিন”কে নির্দেশ করি কি করতে হবে, মেশিন আমাদের “আদেশ” পালন করে। এছাড়াও রাশিবিজ্ঞানের সূত্রেও আমরা স্থির করতে পারি যে কত ফারেনহাইটে কত সেলসিয়াস। কাজের কথা, আমরা যন্ত্রকে নির্দেশ দিই, যন্ত্র সে নির্দেশ পালন করে।

এই যে নির্দেশ দেবার নিয়মবদ্ধতা, এই যে একের পর এক নির্দেশিকা দিয়ে রাখা, কি কি করতে হবে, কিভাবে করতে হবে রান্নার নিয়ম শেখানোর মতন, আমরা যন্ত্রের এই ব্যবহারেই অভ্যস্ত, এ এক ব্যাপার। এতে অবশ্য যন্ত্রের শেখা টেখা কিছু হল না, সে শুধু নির্দেশ পালন করতে লাগল। যন্ত্রকে যদি শেখাতে হয়, তাহলে ব্যাপারটি দাঁড়াবে নীচে যেমন দেখানো আছে, সেই রকম,

যন্ত্রকে শেখানো অন্যরকম। যন্ত্র শিখবে মানে তাকে শেখার মতন তথ্য দিতেও হবে, আর কোনটা ঠিক, কোনটা ভুল সেইটাও জানিয়ে দিতে হবে, তবেই সে শিখবে কিভাবে (অন্তত এক্ষেত্রে) কোন ফর্মুলা যাতে ইনপুট আর আউপুট ফরমুলার সূত্রে মিলে যায়। এখন এটা যেহেতু শেখার এবং শেখানোর পালা, এবং নানারকমের ইনপুট আউটপুট জোড়ায় জোড়ায় শিখে যন্ত্রের ফরমুলা তৈরীর ব্যাপার, এ অনেকটা আমাদের শৈশবে অঙ্ক শেখার মতন | এক জোড়া মাত্র সংখ্যা দিলে হবে না, অজস্র সংখ্যার জোড় দিয়ে শেখাতে হবে তাকে। যত বেশী সংখ্যার জোড় দেবেন, তত “ভালভাবে” সে শিখবে।
এই একই ব্যাপার যন্ত্রকে ছবি চেনানো বা ছবি শেখানোর ক্ষেত্রেও প্রযোজ্য | যন্ত্র ছবি কে আমরা মানুষরা যেভাবে ছবি রূপে দেখি, সে তো ঠিক সেভাবে দেখে না, সে দেখে ছবিকে অঙ্কের হিসেবে। যেমন ধরুন নীচের ছবিটি,

ছবিটা তাজ মহলের, আমাদের, মানুষের পক্ষে চিনতে অসুবিধে হবার কথা নয়, এই তাজমহলই, মেশিনকে চেনাতে গেলে ছবিটিকে টুকরো করে অজস্র ছোট অংশে ভাগ করে ফেলতে হবে এবং প্রতিটি অংশকে ০ থেকে ২৫৫ র মধ্যে একটি সংখ্যা দিয়ে চিহ্নিত করে মেশিনকে দিয়ে অঙ্ক করা শেখানো হবে। শেখাতে গেলে মেশিনকে জানিয়ে দিতে হবে যে এ ছবি তাজ মহলের | মেশিন আন্দাজ করবে, মেশিনের ভুল হবে, শোধরাবে, এবং বারবার এই প্রক্রিয়ার মধ্যে দিয়ে শেখার এক সময় মেশিন স্থির করবে এ ছবি কত শতাংশ তাজমহল হবার কথা। তবে মেশিনকে শেখাতে গেলে একটি মাত্র ছবি দিয়ে দেখালে তো চলবে না, হাজার খানেক ছবি, তার কয়েকটি “ট্রেনিং” বা শেখানোর জন্য রাখা, কয়েকটিকে দিয়ে আলাদা করে যাচাই করানো, আর কয়েকটিকে দিয়ে পরীক্ষা করিয়ে নেয়া যে মেশিন শিখল কি না।
এত কথা লেখার উদ্দেশ্য এইটাই যে মেশিনকে ছবি চেনা, বা অন্য কিছু “শেখাতে” গেলে অল্প কয়েকটি ছবি বা কম ডাটা দিলে চলবে না। এতে উল্টো বিপত্তি, আপাত ভাবে দেখে মনে হবে সে শিখেছে, আসলে সে “মুখস্ত” করছে। কিন্তু শেখা আর মুখস্ত করা এক নয় তো, ফলে নতুন ছবি দেখালে সে আর শনাক্ত করে উঠতে পারে না।
সে কি? নীচের ছবিটি লক্ষ করুন

ওপরে যে চিত্রটি দেখানো হয়েছে, তাতে মেশিনের শেখা না শেখার প্লট | X-axis বরাবর নজর করে দেখুন, প্রক্রিয়া বা epoch দেখানো হয়েছে। মনে করা যাক ১০০ টি ছবি মেশিনকে দেখানো হল এবং সে একবার শিখছে, দুবার শিখছে, এই করে করে ১০০ বার তাকে দিযে শেখানো হচ্ছে। প্রতিবার, সে ভুল করছে, তার পরের বার শুধরে নিচ্ছে | শুধু তাই নয়, এই ১০০ বারের প্রতিবার মেশিন কতটা শিখল, আমরা যাচাই করে নিচ্ছি। কত শতাংশ সে ভুল করছে, সেইটা Y-axis এ দেখানো হয়েছে। যেমন ধরুন, প্রথমবার যখন মেশিনকে শেখানো হল, মেশিন ৯০% ভুল করে বসল (বুঝতেই পারল না এ ছবি তাজমহলের কি না)। কিন্তু সে শেখে দ্রুত, তাই তার ভুলের পরিমাণ ক্রমশ কমতে থাকল। ১০ বার পর্যন্ত দেখুন মেশিনের ট্রেনিং আর যাচাই করার ছবি দিয়ে পরীক্ষা করতে গিয়ে দেখা গেল তারা মোটামুটি একই রকমভাবে ভুল করছে, এবং ভুল শোধরাচ্ছে। ১০ রাউণ্ড শেখানোর পর একটা অদ্ভুত ব্যাপার দেখা গেল। মেশিন ট্রেনিং এর যে ডাটা, তাতে তার ভুলচুক অনেকটা কমে গেল বটে, কিন্তু তাকে যখন যাচাই করা হল, তখন দেখা গেল, তার ভুল করার পরিমাণ শতাংশের হিসেবে বাড়তে লাগল। এই ব্যাপারটি থেকে একটা ব্যাপার বোঝা যাচ্ছে যে মেশিন চেনা ডাটা দিব্য আত্মস্থ করেছে বটে, কিন্তু শেখে নি।

ব্যাপারটি কিরকম জানেন? এ আমাদের ছোটবেলায় নামতা মুখস্থ করার মতন। ১০ এর নামতা ১ থেকে ১০ দিব্য মুখস্থ হয়েছে, অথচ শিক্ষক যেই ১১ দশে কত হয় জিজ্ঞাসা করলেন, তার আর উত্তর নেই | কয়েকজন ছাত্র অবশ্য ইতিমধ্যে দেখেছে, ১০ দিয়ে গুণ করলে সংখ্যাটির পাশে একটি শূণ্য বসালেই উত্তর পাওয়া যায়, এইটে তাদের নামতা “শেখা”, বাকীরা স্রেফ মুখস্থ বিদ্যার ওপর নির্ভর করেছে । এ সমস্ত ক্ষেত্রে শিক্ষক সচরাচর যা করেন, পুনরায় নামতা আত্মস্থ করান, তারপর অন্যান্য সংখ্যা দিয়ে গুণ করিয়ে নামতার “রহস্য” ছাত্রদের “শেখান”। মেশিনের ক্ষেত্রেও অনেকটা একই রকম কাজ হয়।

এত কথা লেখার উদ্দেশ্য এই যে, মেশিনকে যদি “শেখাতে” হয়, তাহলে প্রচুর ডাটা আর তার সংলগ্ন “লেবেল”এর প্রয়োজন হয়। এখন সত্যি বলতে কি, ডাটা লেবেল করার কাজটি খুবই সহজ, যেমন তাজমহলের ছবি দেখে সে যে তাজমহল, এইটা কোথাও লিখে রাখা | এ কাজে যে খুব দক্ষতার প্রয়োজন তা নয়, কিন্তু যেহেতু কৃবু’র কাজে লক্ষ লক্ষ ছবির প্রয়োজন, একজন দুজনের পক্ষে তো এ কাজ সম্ভব নয়।
কাজটি সামান্য, কিন্তু প্রচুর মানুষের প্রয়োজন, এবং এ সমস্ত ক্ষেত্রে সচরাচর যা হয়, যারা এ কাজ করবেন, তাদের কাজ পিছু খুব সামান্য মজুরি দিলেও চলে। ফাই ফাই লি যেমন গবেষণার কাজ করতে গিয়ে এই অদ্ভুত সমস্যার সম্মুখীন হয়েছিলেন, আমাজন কোমপানী তেমনি নিজেদের ব্যবসার কাজ করতে গিয়ে অন্য রকমের “লেবেলিং” এর সমস্যায় পড়েছিল, কাজেই তাদেরও ঐ এক দশা | এই মানুষগুলো লেবেলিং এর কাজ না করে দিলে, এবং সময়মত না করে দিলে আজকের আরটিফিশিয়াল ইনটেলিজেনসের যে ঝাঁ চকচকে অগ্রগতি, তার কিছুই দাঁড়ায় না।
আমরা শুরু করেছিলাম এই বলে যে যান্ত্রিক তুরকী সেযুগে যেমন একটি মানুষের চোখে ধুলো দেওয়ার খেলা বই কিছু ছিল না, যেখান কাজ করত মানুষ আর নাম হত যন্ত্রের, আমাদের এই আমলের আমাজনের যান্ত্রিক তুরকীও প্রকারান্তরে তাই | আমাজন ঠিক কি কারণে বা কি বিবেচনা করে এই নাম স্থির করেছিলেন কে জানে, যদিও কার্যক্ষেত্রে কৃত্রিম বুদ্ধিমত্তা জনিত ব্যবসার যে প্রায় বিস্ফোরণ ঘটছে আমাদের প্রাত্যহিক জীবনে, সেখানে যন্ত্রের যাবতীয় আশ্চর্য কার্যকুশলতার ভিত রয়ে গেছে অগণিত অচেনা, হয়তবা উপেক্ষিত মানুষের কায়িক শ্রমলব্ধ তথ্য অন্বেষণ আর কুশলতায়, যেটুকু না হলে এর কিছুমাত্র হত না। যান্ত্রিক তুরকীর মেশিনের মধ্যে অবস্থিত মানুষটির মতন এঁরাও আমাদের সাধারণ চোখে অদৃশ্য, “অশরীরি” রয়ে গেলেন | প্রায় বেগার খাটছেন প্রতিনিয়ত, এদের নিয়েই আমাদের ভূতের বেগারের গল্প।
পাঠক, এইখানে এই ধরণের কাজের প্রেক্ষিতে, শ্রমিকের অধিকার, তাদের শারীরিক মানসিক স্বাস্থ্যের বিষয়গুলো বিবেচনা করার সময় এসেছে। বিশেষ করে যেভাবে এ আই (কৃবু) এবং তৎসংলগ্ন ব্যবসা-বাণিজ্যের যাকে বলে বিস্ফোরণ ঘটছে প্রতিদিন। সে প্রসঙ্গে আসছি।
(ক্রমশ )

dc | 122.164.84.227 | ০৬ জানুয়ারি ২০২৪ ২০:৩৫527434
এই পর্বটা খুবই ইন্টারেস্টিং, তবে আমার একটু দ্বিমত আছে :-)

অরিন্দমবাবু যে লিখেছেন ডেটা লেবেলিং এর মাধ্যমে মেশিন লার্নিং, সে একেবারে আদিযুগে ছিল। তাকে বলা হয় সুপারভাইজড লার্নিং, সেটা করে খুব একটা ভালো রেজাল্ট হয়নি, অন্তত আজকের লেভেলে তো নয়ই (আজকের বলতে ধরুন ইন্টেলিজেন্ট ড্রাইভিং বা উবের এর সার্জ প্রাইসিং বা চ্যাটবট, মানে ক্লাসিফিকেশান আর প্রেডিকশান দুটোই)। সুপারভাইজড লার্নিং এর পর শুরু হয় আনসুপারভাইজড লার্নিং (উদাহরন k-means বা অন্যান্য ক্লাস্টারিং অ্যালগো), আর রিইনফোর্সড লার্নিং (এটায় অবশ্য কিছু লেবেলিং করা হয়)। আনসুপারভাইজড লার্নিং এর জন্য লেবেল বা ট্রেনিং ডেটার দরকার হয়না।

আর আপনি তো জানেনই, মেশিন লার্নিং এর আসল প্রোগ্রেস শুরু হয়েছে মাল্টি নিউরন নেটওয়ার্ক বা কনভোলিউশান নিউরাল নেটওয়ার্ক তৈরি হওয়ার পর। বিশেষ করে, সিএনএন বাজারে আসার পর তো ডেটাসেটের ফিচারও লার্নিং অ্যালগোটাই সিলেক্ট করে। ডিজাইনারদের কাজ সেক্ষেত্রে হয় ওয়েট আর বায়াস কন্ট্রোল করা, বা অন্যান্য প্যারামিটার ম্যানিপুলেট করা।

মানে এটা বলতে চাইছি যে "যদিও কার্যক্ষেত্রে কৃত্রিম বুদ্ধিমত্তা জনিত ব্যবসার যে প্রায় বিস্ফোরণ ঘটছে আমাদের প্রাত্যহিক জীবনে, সেখানে যন্ত্রের যাবতীয় আশ্চর্য কার্যকুশলতার ভিত রয়ে গেছে অগণিত অচেনা, হয়তবা উপেক্ষিত মানুষের কায়িক শ্রমলব্ধ তথ্য অন্বেষণ আর কুশলতায়, যেটুকু না হলে এর কিছুমাত্র হত না" - এটা মনে হয় ঠিক হলো না। একটা সময়ে প্রচুর লোক লেবেলিং এর কাজে যুক্ত হয়েছিলেন ঠিকই, আর তাদের হয়তো সেরকম রিকগনিশান মেলেনি, আরও মেলা উচিত ছিল, কিন্তু তাদের কাজের ভিত্তিতে মেশিন লার্নিং আজকের লেভেলে পৌঁছয়নি বলে মনে হয়।

Arindam Basu | ০৬ জানুয়ারি ২০২৪ ২২:২৬527440
আপনার পয়েন্ট কিছুটা মানছি, পুরোটা নয় । এটা ঠিকই, যে, একজন যেভাবে আনসুপারভািজঠড লার্নিং বা ডিফিউশন মডেলের যুগে বহু অ্যাপ্লিকেশন আসছে, সেটা কিন্তু অপেক্ষাকৃত নতুন। তার মানে এই নয় যে সুপারভাইজ লার্নিং আর কেউ ব্যবহার করেন না। সেটা একটা দিক। তবে এ ছাড়াও এই ghost work বা ভূতের বেগার খাটার আরো অনেক দিক রয়েছে, যেগুলো নিয়ে চিন্তাভাবনারসঅবকাশ রয়েছে। যেহেতু মডেল ট্রেনিং বারবার করার, এবং ফিরে দেখার একটি ব্যাপার থাকেই, লেবেলিং এর কাজ যে শেষ হয়ে গেছে, এমন বলা যায় না মনে হয়।

Arindam Basu | ০৭ জানুয়ারি ২০২৪ ০৩:০০527445
@dc , সত্যি ২০২৪ এর প্রেক্ষিতে দেখলে সুপারভাইজড লার্নিং নিয়ে এতটা লেখা আর সেমি সুপারভাইজড বা আনসুপারভাইজড লার্নিং নিয়ে কোন কথা না বলাটা কতটা যুক্তিযুক্ত বিশেষ করে যে সময়ে আনসুপারভাইজড লার্নিং এর এখন প্রবল প্রতাপ। এখানে যে কথাটা বলার, এই লেখাটি ঠিক কৃত্রিম বুদ্ধিমত্তা নিয়ে নয়, বরং তাকে কেন্দ্র করে কাজ আর কাজ জনিত জনস্বাস্থ্য বা মনে করা যাক কৃত্রিম বুদ্ধিমত্তার মানুষের (সমাজের/কাজের) ওপর কি প্রভাব, মূলত তাই নিয়ে। এর মধ্যে প্রথম দিকটায় গিগ ইকনমি আর ভৌতিক কাজের ব্যাপারটা নিয়ে লিখতে গিয়ে এতটা লিখতে হল।

dc | 2401:4900:1cd1:c2f2:802c:ad8f:2a38:31e0 | ০৭ জানুয়ারি ২০২৪ ০৮:০৮527448
অরিন্দমবাবুর ২২ঃ২৬ এর পোস্ট এর সাথে অনেকটাই একমত। নিউরাল নেটওয়ার্ক বেসড লার্নিং এও হিউম্যান ফিডব্যাক আর ইন্টারভেনশান আছে, বিশেষ করে রিকোয়েস্ট-রেসপন্স পেয়ার ট্রেনিং এর জন্য অনেক লোকের দরকার হয় (প্রম্পট ইন্জিনিয়ারিং), স্টকাস্টিক গ্রেডিয়েন্ট অ্যালগো বানাতেও প্রচুর লোক কাজ করছেন। রেসপন্স র‌্যাংকিং এর জন্যও বড়ো বড়ো টিম কাজ করছে। সুপারভাইজড লার্নিং বা হিউম্যান ফিডব্যাক অবশ্যই এখনও আছে, বিশেষত লার্জ ল্যাংগুয়েজ মডেলগুলোতেও হিউম্যান ফিডব্যাক অনেকগুলো জায়গায় দরকার হয়। তবে আমি বলতে চাইছিলাম, এগুলো লেবেলিং এর মতো "লো লেভেল" কাজ নয়, সেটা আগে বেশী দরকার হতো।

"এই ghost work বা ভূতের বেগার খাটার আরো অনেক দিক রয়েছে, যেগুলো নিয়ে চিন্তাভাবনারসঅবকাশ রয়েছে" - একমত। বিশেষত, ভুতের বেগার খাটার আরেকটা দিক আছে, সেটা হলো, এখনকার লার্জ ল্যাংগুয়েজ মডেলগুলো বা তাদের পূর্বসূরি নিউরাল নেটওয়ার্কগুলোকে ডেটা সাপ্লাই করা। এই মডেলগুলোতে ইনপুট হিসেবে যে গিগাবাইটস অফ ডেটা ফিড করা হয়েছে, সেটা সারা পৃথিবী জুড়ে আমরা সবাই সাপ্লাই করেছি, কখনো জেনে কিন্তু বেশীর ভাগ সময়েই না জেনে। আমরা যখন নেটে ব্রাউজ করেছি, বাজারে গিয়ে জিনিস কিনেছি, কোথাও ঘুরতে গেছি, বাড়ির মধ্যে বসে টিভি দেখেছি ইত্যাদি তখন আমরা যে ডেটা জেনারেট করেছি সেই ডেটাই ব্যবহার হয়েছে বা এখনও হচ্ছে মডেল ডেভেলপ করার জন্য। এই দিকটা নিয়ে সেরকম আলোচনা হয়না, আমাদের ডেটা দিয়েই যে গুগল, আপেল, টেসল বা মাইক্রোসফ্ট কোটি টাকার ব্যবসা করছে সে কথাও খুব একটা খবরে আসে না।

dc | 2401:4900:1cd1:c2f2:802c:ad8f:2a38:31e0 | ০৭ জানুয়ারি ২০২৪ ০৮:১৩527449
মানে মেকানিকাল টার্কের কথা যদি বলতেই হয় তো আমরা সব্বাই, আমাদের অজান্তেই, মেকানিকাল টার্কের মতো করে ইনপুট দিয়ে চলেছি (বা মেশিনের মধ্যে ভুতের মতো ঢুকে বসে আছি) আর আমাদের সেই লেবার বা ডেটা দিয়েই ট্রিলিয়ন ডলারের ব্যবসা হচ্ছে।

dc | 2401:4900:1cd1:c2f2:802c:ad8f:2a38:31e0 | ০৭ জানুয়ারি ২০২৪ ০৮:৩৭527450
বিটিডাব্লু, গুগল আর আপেল বলছে ব্রাউজারের থার্ড পার্টি ট্র‌্যাকিং কুকি নাকি বন্ধ করে দেবে। তার কারন বোধায় পুরো ইন্টারনেটেই এখন এতো বেশী বট ভরে গেছে যে কুকি দিয়ে ট্র‌্যাকিং ও আর দরকার হচ্ছে না, স্রেফ ইন্টারনেট ব্রাউজ করলেই আমাদের ব্রাউজিং হ্যাবিট বোঝা যাচ্ছে, সেখান থেকে প্রেডিকটিভ মডেলগুলো আমাদের বিহেভিয়ার প্রেডিক্ট করতে পারছে।

Arindam Basu | ০৮ জানুয়ারি ২০২৪ ০৪:০৭527477
dc, ভাল বললেন, আলোচনাটিকে এগিয়ে নিয়ে যাবার জন্য ধন্যবাদ।

a | 203.221.17.242 | ০৮ জানুয়ারি ২০২৪ ০৭:০৩527479
"তাকে বলা হয় সুপারভাইজড লার্নিং, সেটা করে খুব একটা ভালো রেজাল্ট হয়নি, অন্তত আজকের লেভেলে তো নয়ই"-- এইটা

আর

"মেশিন লার্নিং এর আসল প্রোগ্রেস শুরু হয়েছে মাল্টি নিউরন নেটওয়ার্ক বা কনভোলিউশান নিউরাল নেটওয়ার্ক তৈরি হওয়ার পর।"

এই দুটি মন্তব্য খুব সুইপিং লাগল -- আর সঠিক বলেও মনে হল না।

dc | 2401:4900:1f2b:f430:c444:cdc:10a6:a11f | ০৮ জানুয়ারি ২০২৪ ০৮:০৭527481
a, এই দুটো ব্যপার নিয়ে যদি বিশদে লেখেন তো খুব ভালো লাগবে।

lcm | ০৮ জানুয়ারি ২০২৪ ১৩:৪৬527488
সুপারভাইজ্ড লার্নিং - ভবিষ্যৎবাণী করিতে ব্যবহার হয় - নস্ট্রাডুমাস এই পদ্ধতি ব্যবহার করতেন কিনা জানা যায় না
-----

আনসুপারভাইজ্ড লার্নিং - শ্রেণীবিন্যাস এর জন্য ব্যবহার হয় - কার্ল মার্ক্স এর সহিত কোনো সম্পর্ক আছে বলিয়া জানা নাই

lcm | ০৮ জানুয়ারি ২০২৪ ১৪:২২527489
তবে কিনা আসিতেছে, আত্মসচেতনতা আসিতেছে -

a | 203.221.17.242 | ০৮ জানুয়ারি ২০২৪ ১৬:৫৩527495
এবিষয়ে অসামান্য অধিকারী লোকজন এপাড়ায় রয়েছেন - ওনারা নিশ্চয় বিশদে লিখবেন। আমি শিক্ষার্থী মাত্র

dc | 2401:4900:1f2b:f430:c444:cdc:10a6:a11f | ০৮ জানুয়ারি ২০২৪ ২০:২৪527498
a, অবশ্যই, অন্যরাও লিখলে ভালো হয়। আমিও একেবারেই ছাত্র, ভুল সংশোধন করে নিতে পারলে খুশী হবো।

সমরেশ মুখার্জী | ০৮ জানুয়ারি ২০২৪ ২৩:৩১527507
অরিনবাবু‌র উত্থাপিত বিষয়টি আকর্ষণীয় কিন্তু জটিল। এ বিষয়ে যাদের ডোমেন নলেজ আছে তারা ভালো বুঝবে। এ বিষয়ে আমার জ্ঞান খুব কম। তবু কয়েকটি কথা বলতে ইচ্ছে করছে:

1. Deep Blue versus Garry Kasparov was a pair of six-game chess matches between then-world chess champion Garry Kasparov and an IBM supercomputer called Deep Blue. Kasparov won the first match, held in Philadelphia in 1996, by 4–2. Deep Blue won a 1997 rematch held in New York City by 3½–2½. The second match was the first defeat of a reigning world chess champion by a computer under tournament conditions, and was the subject of a documentary film, Game Over: Kasparov and the Machine. (WiKi)

তখন টিভি ইন্টারভিউ‌তে IBM এর Deep Blue কোর ডেভেলপার টিমের একজনের দুটো কথা বেশ মনে আছে।

এক- DB হয়তো সেকেন্ডে millions of move alternatives upto tens of steps ahead ভেবে best possible scenario হিসেবে একটা চাল দিল কিন্তু কাসপারভ যেহেতু মানুষ তিনি এমন একটা পরবর্তী চাল দিলেন যা BB’র ধারণা করে ঐ ক্ষেত্রে প্রতিপক্ষের best assumed নয় মুভ নয়। ফলে DB খেলো চকমা।

দুই - মানুষের NI (Natural Intelligence) বা স্বাভাবিক বুদ্ধি কিছু ব‍্যাপার সহজে বুঝতে পারে - যেমন - Intended Meaning - অর্থাৎ কোনো শ্লেষ, বক্রোক্তি, তির্যক উক্তি, ইংগিত, প্রতীক, রূপক ইত‍্যাদির ক্ষেত্রে যা বলা হচ্ছে তার সারফেস লেভেলের আপাতবোধ‍্য ব‍্যাপার‌টি ছাড়িয়ে বা উপেক্ষা করে সে সঠিক বুঝে যাবে সেক্ষেত্রে বক্তা আসলে কী মীন করতে চাইছেন। কিন্তু কৃত্রিম বুদ্ধিমত্তা‌র পক্ষে এই ব‍্যাপার‌টা বোঝা বা ডেভেলপারের পক্ষে তাকে এই ব‍্যাপারে ট্রেইন করা বেশ শক্ত।

হয়তো এখন Generative AI বা হ‍্যানসেন রোবোটিক্সের continuously self learning social robots এসে এই ব‍্যাপার‌টা অনেক এগিয়ে গেছে। অন্ততঃ সোফিয়ার সাথে উইল স্মিথের এই ইন্টারভিউ‌টা কয়েকবার দেখে মনে হয়েছে - সেদিন দুরে নয় যেদিন হিউম‍্যানয়েড রোবটের সাথে কথা বলে বোঝা যাবে না আমি মানুষ না মেশিক - কার সাথে interact করছি। থাকলো সেই ইন্টারভিটা।

কতটা নিতে পারবো জানি না তাও পড়ছি।

সমরেশ মুখার্জী | ০৮ জানুয়ারি ২০২৪ ২৩:৪১527508
BB’র ধারণা করে = DB'র ধারণা করা

Arindam Basu | ০৯ জানুয়ারি ২০২৪ ০২:১১527510
সমরেশবাবু, "কিন্তু কাসপারভ যেহেতু মানুষ তিনি এমন একটা পরবর্তী চাল দিলেন যা BB’র ধারণা করে ঐ ক্ষেত্রে প্রতিপক্ষের best assumed নয় মুভ নয়। ফলে DB খেলো চকমা। ... মানুষের NI (Natural Intelligence) বা স্বাভাবিক বুদ্ধি কিছু ব‍্যাপার সহজে বুঝতে পারে - যেমন - Intended Meaning - অর্থাৎ কোনো শ্লেষ, বক্রোক্তি, তির্যক উক্তি, ইংগিত, প্রতীক, রূপক ইত‍্যাদির ক্ষেত্রে যা বলা হচ্ছে তার সারফেস লেভেলের আপাতবোধ‍্য ব‍্যাপার‌টি ছাড়িয়ে বা উপেক্ষা করে সে সঠিক বুঝে যাবে সেক্ষেত্রে বক্তা আসলে কী মীন করতে চাইছেন। কিন্তু কৃত্রিম বুদ্ধিমত্তা‌র পক্ষে এই ব‍্যাপার‌টা বোঝা বা ডেভেলপারের পক্ষে তাকে এই ব‍্যাপারে ট্রেইন করা বেশ শক্ত। ... সেদিন দুরে নয় যেদিন হিউম‍্যানয়েড রোবটের সাথে কথা বলে বোঝা যাবে না আমি মানুষ না মেশিক"

Deep Blue কাসপারভকে হারিয়ে দিযেছিল ১৯৯৭ সালে | তারপর মেশিন লার্নিং এর বহু অগ্রগতি হয়েছে। এর প্রায় কুড়ি বছর পরে, ২০১৬ সালে DeepMind নামে একটি কম্পিউটার গো খেলায় (গো খেলাটি অনেকটা আমাদের দেশের বাঘবন্দী খেলার মতন, সাদা কালো ঘুঁটি দিয়ে চৌকো সাদা কালো বোর্ডে খেলতে হয়, ভারি সুন্দর খেলা, খেলাটি স্ট্র্যাটেজির খেলা), সে সময়কার চ্যমপিয়ন লে সেদল কে খেলায় হারিয়ে দেয়। তবে ডিপ ব্লুর মতন, ডিপ মাইন্ডের আলফা গো কেও প্রথমে ডেভেলপাররা অজস্র প্যাটার্ণ চিনিয়ে "ট্রেনিং" দিয়েছিলেন। গুগল ডিপ মাইণ্ড কোমপানীকে কিনে নেয় এবং ২০১৭ তে গুগল আলফাগো জিরো নামে প্রোগ্রাম তৈরী করে reinforcement learning দিয়ে, যে প্রায় নিজের সঙ্গে নিজে খেলতে খেলতে একসপারট হয় এবং কালক্রমে আলফাগোকেও হারাতে সক্ষম হয়। সে প্রোগ্রাম এতটাই দক্ষ যে তার সম্বন্ধে লিখতে গিয়ে চীনা গো খেলোয়াড় কে জিয়ে নাকি বলেছিলেন,
> Chinese Weiqi master Ke Jie commented on the remarkable accomplishments of the new program via his Weibo account, "A pure self-learning AlphaGo is the strongest, humans seem redundant in front of its self-improvement."
(https://www.ecns.cn/2017/10-19/277691.shtml )
কথাগুলো এইজন্য লিখলাম যে এখন মানুষের ইমোশন মাপার বিষয়টিও আসছে ("affective computing") | আমার দীর্ঘদিনের বন্ধু মার্ক বিলিংহারসটের প্রচুর কাজকর্ম আছে empathic computing নিয়ে মানে মানুষের মত করে কমপিটারের "ভাবনা চিন্তা" করা।

আসলে এই লেখাটির উদ্দেশ্য এ আই এর শুধু একটা দিক নিয়ে আলোচনা করা, সেটা এ আই এবং তার মধ্যেকার অগণিত মানুষ, যাদের কাজকর্ম অন্তর্নিহিত হয়ে রয়েছে, তাদের নিয়ে। কখনো যদি সুযোগ সুবিধে হয় এ আই নিয়ে আরো বিশদে লেখার ইচ্ছে রইল।

dc | 2401:4900:1f2b:3368:500a:4b36:fe56:5a36 | ০৯ জানুয়ারি ২০২৪ ০৮:৪৭527512
সমরেশবাবু একটা অসাধারন পয়েন্ট লিখেছেন, যাকে বলা যায় এআই রিসার্চের একেবারে মূল পয়েন্ট, যা নিয়ে বহু দশক ধরে ফিলোজফার, ফিসিজিস্ট, আর কম্পিউটার সায়েন্টিস্ট দের মধ্যে বিতর্ক চলছে। তবে আগে একটা ব্যপার পরিষ্কার করে নেওয়া ভালো - বেশ কিছু বছর ধরে অনেকগুলো কোম্পানি মেশিন লার্নিং কে মার্কেট করার জন্য হঠাত করে "এআই" টার্মটা ব্যবহার করতে শুরু করেছে, ফলে এখন আরেকটা টার্ম এসেছে, "আর্টিফিসিয়াল জেনারাল ইনটেলিজেন্স" বা এজিআই। তবে বহু দশক ধরে এআই বলতে এজিআই কেই বোঝানো হতো, আর এই এআই এর দুটো ভাগ ছিলো (বা আছে), স্ট্রং এআই আর উইক এআই।

এবার সমরেশবাবুর পয়েন্টঃ "দুই - মানুষের NI (Natural Intelligence) বা স্বাভাবিক বুদ্ধি কিছু ব‍্যাপার সহজে বুঝতে পারে"। সমরেশবাবু দাবা খেলার উদাহরন দিয়েছেন, তবে অরিন্দমবাবু যেমন লিখেছেন, দাবা আর গো, এই দুটো খেলাতেই মেশিন লার্নিং এর প্রভূত উন্নতি হয়েছে, এখনকার প্রোগ্রামগুলো সেরা হিউম্যান প্লেয়ারদেরও হারিয়ে দিতে পারছে, যা বহুদিন ধরে মনে করা হতো সম্ভব না (বিশেষ করে গো খেলা)। কিন্তু তাও, এআই রিসার্চের একটা মূল প্রশ্ন হলো এইটাঃ এআই কি সত্যিই "বুঝতে পারে", নাকি স্রেফ "বুঝতে পারা" কে মিমিক করে? এই প্রশ্নটা প্রথম তুলেছিলেন ফিলোজফার John Searle, একটা থট এক্সপেরিমেন্টের মাধ্যমে, যার নাম চাইনিজ রুম।

সার্লের এক্সপেরিমেন্টটা এরকমঃ ধরা যাক একটা বন্ধ ঘরের একটা জানলা আছে আর তার ভেতরে একটা কম্পিউটারে একটা প্রোগ্রাম রান করছে, যে প্রোগ্রামটা ইনপুট নিতে আর আউটপুট দিতে পারে। এবার একজন চীনে একটা কাগজে চীনে ভাষায় প্রশ্ন লিখে জানলা দিয়ে ভেতরে পাঠিয়ে দিলেন, খানিক পর চীনে ভাষায় তাঁর প্রশ্নের উত্তর পেয়ে গেলেন। অর্থাত প্রোগ্রামটার কাছে সমস্ত চীনে ক্যারেক্টারের একটা লিস্ট আছে আর একটা ইনস্ট্রাকশান সেট আছে, যেখানে বলা আছে কোন ক্যারেক্টার ইনপুট এলে কোন ক্যারেক্টার আউটপুট করতে হবে। তো চীনে ভদ্রলোক সারাদিন ধরে জানলা দিয়ে প্রশ্ন আর উত্তর আদান প্রদান করলেন, এখন যেমন আমরা চ্যাটজিপিটিতে করি, আর দিনের শেষে উনি বললেন যে উনি সন্তুষ্ট। অর্থাত প্রোগ্রামটা টুরিং টেস্ট পাশ করে গেল। এবার ধরা যাক, ঘরটার মধ্যে একজন ইংলিশ বা ভারতীয় স্পিকারকেও রাখা হলো, যাঁরা চীনে ভাষা জানেন না, কিন্তু তাঁদেরকেও একইরকম ক্যারেক্টার লিস্ট আর ইংরেজি বা কোন ভারতীয় ভাষায় ইনস্ট্রাকশান সেট দিয়ে দেওয়া হলো। এনারাও, প্রোগ্রামটার মতো, নিজের নিজের ভাষায় ইনস্ট্রাকশান ফলো করে চীনে ভাষায় উত্তর সাপ্লাই করতে থাকলেন। প্রশ্ন হলো, এনারা কি চীনে ভাষা বুঝতে পারেন? সার্লের প্রশ্ন ছিলো, প্রোগ্রামটাও কি চীনে ভাষা বুঝতে পারে, নাকি স্রেফ বুঝতে পারা সিমুলেট করতে পারে? "বুঝতে পারা" অ্যাচিভ করতে পারা হলো স্ট্রং এআই রিসার্চের বিষয়, আর "বুঝতে পারাকে সিমুলেট করা" হলো উইক এআই রিসার্চের গোল।

অবশ্যই, সার্লের এই প্রশ্নের নানাভাবে উত্তর দেওয়ার চেষ্টা হয়েছে, যেমন সিস্টেম রিপ্লাই, ভার্চুয়াল মাইন্ড রিপ্লাই ইত্যাদি। তবে সার্লের প্রশ্নটা আরও বড়ো করে দেখলে, মাইন্ড অ্যান্ড বডি ফিলোজফির একটা অংশ, যেখানে প্রশ্ন করা হয় যে একটা কম্পিউটার প্রোগ্রামের কি true understanding থাকতে পারে? আর সেটা হলে কি সেই প্রোগ্রামটার consciousness ও থাকবে? সমরেশবাবু যে লিখলেন, মানুষের বুদ্ধি কিছু ব‍্যাপার সহজে বুঝতে পারে, অর্থাত কিনা হিউম্যান ইনসাইট, তার প্রকৃত স্বরূপ কি? কিছু কিছু প্রব্লেম আছে যেগুলো আনডিসাইডেবল বা নন-কম্পুটেশনাল (যেমন হল্টিং প্রব্লেম), যেগুলো কোন অ্যালগোরিদম দিয়ে সল্ভ করা সম্ভব নয়, অর্থাত এই ধরনের প্রশ্নগুলোর উত্তর কোন প্রোগ্রাম দিতে পারে না। কিছু ফোলোজফার আর ফিজিসিস্ট, যেমন রজার পেনরোজ, মনে করেন মানুষের থট প্রসেসের অন্তত খানিকটা অংশ নন-কম্পুটেশনাল, আর এই নন-কম্পুটেশনাল প্রসেস এর ফলেই মানুষের কনশাসনেসের উৎপত্তি। ফলে, এনাদের মতে, কোন এআই কখনো মানুষের মতো করে চিন্তা করতে পারবে না।

dc | 2401:4900:1f2b:3368:500a:4b36:fe56:5a36 | ০৯ জানুয়ারি ২০২৪ ০৮:৫৬527513
সার্লের চাইনিজ রুম আর্গুমেন্ট নিয়ে এখানে আরও পড়তে পারেনঃ
https://plato.stanford.edu/entries/chinese-room/#MindBody

আর কম্পুটেশনাল বনাম নন-কম্পুটেশনাল প্রসেস নিয়ে একটা ভালো প্রস্তাব হলো পেনরোজ-লুকাস আর্গুমেন্ট, সেটার উইকি লিংকঃ
https://en.wikipedia.org/wiki/Penrose%E2%80%93Lucas_argument

Bratin Das | ০৯ জানুয়ারি ২০২৪ ০৯:৪৫527514
অরিন দা সিরিজ টা খুব ভালো হচ্ছে

দাবা নিয়ে আমি একটা গল্প পড়েছিলাম একটা লোক বহুলোকের সাথে দাবি ধরেছিল সে কারাপাভ বা কাসপারভ কে হারিয়ে দেবে ।সবাই জানে সে হারবে তাই প্রচুর টাকা লোকজন বাজি লাগিয়েছে . সে নির্দির্ষ্ট দিনে দুটো ঘরে খেলা শুরু করলো একটাতে কারাপাত অন্য্ তাতে কাস্পারভ ।কারপভ সাদা কাস্পারভ কালো ।বেসিক্যালি সে কারাপাভযা চাল দিছে সেই  দান  টা
ওঘরে দিয়ে আসছে এবং  উল্টোটা । ড্র হবে না ধরে নিয়ে বেসিক্যালি সে কারপভের বিরুদ্ধে কাসপারভ কে লড়িয়ে দিয়েছে। যেই জিতুক জিত তার ই

গল্প টা ছেলে ভোলানো হলেও আইডিয়া ব্রেশ  ,

সমরেশ মুখার্জী | ০৯ জানুয়ারি ২০২৪ ১১:৩৭527515
অরিনবাবু - আপনি এই থ্রেডে AI নিয়ে একটি বিশেষ প্রসঙ্গে লিখতে চাইছেন - contribution of numerous shadow workers during development of AI and thereafter how that AI itself will subsume (or already started doing that) many human works making many people redundant especially low skill, repetitive nature of jobs or even coder, tester etc. এটা খুব দুশ্চিন্তা‌জনক.

তবে dc যেটা বললেন, মানুষের ভাবনার যেসব non computational aspects - যেমন ধরুন intuition, gut feeling, empathy, affection, loyalty, betrayal, revenge, creative attributes, out of the box thinking etc এসব যদি AGI ক্রমশ রপ্ত করে ফেলে, তাহলে যে কী হবে ভেবে শংকা হয়।

কথায় বলে if someone needs to explain a joke after saying it, that is pathetic and if someone responds seriously against a joke that is disaster. এবার উইল স্মিথের সাথে (continuously self learning robot) সোফিয়ার সাক্ষাৎ‌কারটা খেয়াল করুন। উইল স্মিথ যখন বললেন- let me tell you a joke - সোফিয়া তৎক্ষণাৎ জবাব দিলো - it’s an irrational human behavior. ভালো কথা। কিন্তু জোকটা শুনে, একটু সময় নিয়ে প্রসেস করে সে যা জবাব দিলো (I am made up of mostly silicone, plastic…) সেটা একটা disaster.

আবার স্মিথ যখন তাকে exaggerated lip posture সহযোগে কিসি করতে গেলো, সময় নিয়ে দেখে ভেবে সে একদম রক্তমাংসের মানবীর মতো একটা জবাব দিলো - (kiss at first sight is not desirable) let us be friends first. এবং তখন সে দুষ্টু হেসে যেভাবে চোখ মটকালো - আমি হতবাক হয়ে গেছি। এই‌খানে অব‍্যর্থ congruence of communication হয়েছে between spoken words and facial expression.

এলন মাস্কের মতো হারারি‌ও সাবধান করে যাচ্ছেন - task specific ঠিক আছে কিন্তু uncontrolled, boundless development of AI may spell disaster for humans. এই প্রসঙ্গে হারারির একটা দীর্ঘ লেকচার শুনেছি‌লাম। তার একটা বক্তব্য বেশ ভাবিয়েছে - এযাবৎ মানুষ কম্পিউটার আবিস্কার ও উন্নতি করেছে নিজের প্রয়োজনে (defined requirements) কিন্তু নিউরাল নেটওয়ার্ক, self learning AI নিয়ে কাজ করতে গিয়ে বিজ্ঞানীরা দেখলেন - একটা সময়ের পর সে যে কোন দিশায় “ভাবছে” তার হদিশ পাওয়া যাচ্ছে না‌।

হারারি আরো বললেন, যারা ভাবছেন মেশিন কোনোদিন মানুষের মতো ভাবনা, অনুভূতির নাগাল পাবে না এবং তা প্রকাশ‌ও করতে পারবে না, (acquire and manifest) তারা জেনে রাখুন - তার কোনো প্রয়োজন‌ই নেই - it just mimmic and manipulate human emotions - এবং তার পরিণাম কী হতে পারে তার উদারণ - ফেক ভিডিও দেখে মব লিঞ্চিং।

dc ও এমন কিছু হাইলাইট করেছেন (সত্যিই ভাবে না সেটা মিমিক করে)

যাকগে এসব নিছক আশকথা পাশকথা - অরিনবাবু আপনি আপনার ফোকাসে লিখতে থাকুন।

Arindam Basu | ০৯ জানুয়ারি ২০২৪ ১১:৪৬527516
সমরেশবাবু, dc ও আপনার লেখায় খুব ভাল পয়েন্ট কতগুলো উঠে আসছে, যার কয়েকটি দিক নিয়ে, বিশেষ করে কমপিউটেশনাল নিউরোসায়েনসের কিছু দিক নিয়ে ভাবনার অবকাশ রয়েছে বৈকি। এবং একটু বিবেচনা করে দেখলে দেখা যাবে আমাদের কাজের ধরণেও পরিবর্তন আসছে।
মনের থিওরী অতি জটিল। এক যুগে ফাইনম্যান, ডেনেট, সার্ল, নতুন সহস্রাব্দে কার্ল ফ্রিস্টনের অ্যাকটিভ ইনফারেনস আর ফ্রি এনার্জি নতুন করে ভাবাচ্ছে।
আসলে চেতনার স্বরূপ অত্যন্ত জটিল।

dc | 2401:4900:1f2b:3368:bccb:96cb:5b1:40df | ০৯ জানুয়ারি ২০২৪ ১৪:৪৬527519
"এসব যদি AGI ক্রমশ রপ্ত করে ফেলে, তাহলে যে কী হবে ভেবে শংকা হয়"

সমরেশবাবু, মানুষ যেভাবে চিন্তা করে, অর্থাত অ্যাবস্ট্র‌্যাক্ট থিংকিং, তার ধারে কাছেও এআই যেতে পারেনি। কাজেই এখনই ভয় পাবেন না, সেজায়গায় যেতে আমাদের এখনো বহু দেরি আছে :-)

তার কারন হলো এইটাঃ "আসলে চেতনার স্বরূপ অত্যন্ত জটিল"। আসলে নেচার অফ কনশাসনেস বহু পুরনো ডিবেটের বিষয়, সেই প্রাচীন গ্রিক ফিলোজফারদের থেকে সে তর্ক শুরু হয়েছিল। এখন যদিও নিউরোসায়েন্টিস্ট আর নিউরোসার্জেনরা ব্রেনের রিসার্চে অনেক উন্নতি করেছেন, এফএমআরাই এর সাহায্যে এমনকি আমরা নিউরনগুলোর ফায়ারিং অবধি দেখতে পারি, তবুও কনশাসনেস ঠিক কি, আর আমাদের ব্রেনে কিভাবে এর উৎপত্তি হয়, সে ব্যপারে আমরা এক পাও এগোতে পারিনি। নেচার অফ কনশাসনেস চেতনার স্বরূপের প্রশ্নের সাথে আরও বেশ কিছু প্রশ্ন জড়িয়ে আছে, যেমন নেচার অফ ফ্রি উইল, নেচার অফ ম্যাথামেটিকাল রিজনিং ইত্যাদি, যেগুলোর উত্তর না পেলে আমরা মানুষের মতো চিন্তা করে এরকম এআই বানাতে পারবোনা। এ প্রসঙ্গে Henri Poincare এর ১৯০২ সালে লেখা বই Science and Hypothesis থেকে একটা উধৃতি দিইঃ

The very possibility of mathematical science seems an insoluble contradiction. If this science is only deductive in appearance, from whence is derived that perfect rigour which is challenged by none? If, on the contrary, all the propositions which it enunciates may be derived in order by the rules of formal logic, how is it that mathematics is not reduced to a gigantic tautology?

তো আমরা নিজেরাই যদি ম্যাথামেটিকাল রিজনিং এর স্বরূপ না বুঝতে পেরে থাকি, তাহলে কম্পিউটারকে শেখাবো কিভাবে?

পাতা : ১২

গুরুভার আমার গুরু গুরুতে নতুন? বন্ধুদের জানান

গুরুচণ্ডা৯-র গ্রাহক হোন
কোনোরকম কর্পোরেট ফান্ডিং ছাড়া সম্পূর্ণরূপে জনতার শ্রম ও অর্থে পরিচালিত এই নন-প্রফিট এবং স্বাধীন উদ্যোগটিকে বাঁচিয়ে রাখতে গুরুচণ্ডা৯-র গ্রাহক হোন। গুরুচণ্ডা৯তে প্রকাশিত লেখাগুলি পেতে চাইলে আমাদের হোয়াটসঅ্যাপ গ্রুপে যুক্ত হোন, অথবা, আমাদের টেলিগ্রাম চ্যানেলটির গ্রাহক হোন।

ভাটিয়ালি | টইপত্তর | বুলবুলভাজা | হরিদাস পাল | খেরোর খাতা | বই

এই সাইটটি

বার পঠিত

বুলবুলভাজা : সর্বশেষ লেখাগুলি

এই বর্ষার কবিতা : সোমনাথ রায়
(লিখছেন... অমিতাভ চক্রবর্ত্তী)

বৈদিক গণিত বিপন্ন? : সুনন্দ পাত্র
(লিখছেন... কচ্ছপ, Debasis Bhattacharya, Debasis Bhattacharya)

বিপ্লবের আগুন - পর্ব চোদ্দ : কিশোর ঘোষাল
(লিখছেন... অমিতাভ চক্রবর্ত্তী, মোহাম্মদ কাজী মামুন , Kishore Ghosal)

ক্যালিডোস্কোপে দেখা – ভো-কাট্টা : অমিতাভ চক্রবর্ত্তী
(লিখছেন... অমিতাভ চক্রবর্ত্তী, অভিজিৎ। , অমিতাভ চক্রবর্ত্তী)

চেকিয়া এক : হীরেন সিংহরায়
(লিখছেন... হীরেন সিংহরায়, Rouhin Banerjee, R.K)

হরিদাস পালেরা : যাঁরা সম্প্রতি লিখেছেন

ঔপনিবেশিক হিন্দু আইন : ২ : এলেবেলে
(লিখছেন... )

কিষেণজি মৃত্যু রহস্য - পর্ব ১৯ : বিতনু চট্টোপাধ্যায়
(লিখছেন... অসিতবরণ বিশ্বাস , দ)

তোমার বাস কোথা যে...- ১২ : Nirmalya Nag
(লিখছেন... দ)

বিশ্বভরা প্রাণ : মোহাম্মদ কাজী মামুন
(লিখছেন... aranya , হীরেন সিংহরায়, পাপাঙ্গুল)

তোমারে বধিবে যে... : বিপ্লব রহমান
(লিখছেন... r2h, Guru)

টইপত্তর : সর্বশেষ লেখাগুলি

গিন্নি কি শুধু ঘর মোছেন? : Ranjan Roy
(লিখছেন... :|:, রঞ্জন , :|:)

বাংলাদেশ আপডেট : সৈকত বন্দ্যোপাধ্যায়
(লিখছেন... ., Guru, Guru)

অঞ্জন চৌধুরী কি ব্রাত্যই থেকে যাবেন? : অঞ্জন চৌধুরীকে নিয়ে উৎসাহী
(লিখছেন... )

ফিরহাদ হাকিম ও তসলিমা : দীপ
(লিখছেন... দীপ, দীপ , ar)

গণ বিজ্ঞান আন্দোলন ও বাম শক্তি : &/
(লিখছেন... কৌতূহলী, Debasis Bhattacharya, কৌতূহলী)

কি, কেন, ইত্যাদি
বাজার অর্থনীতির ধরাবাঁধা খাদ্য-খাদক সম্পর্কের বাইরে বেরিয়ে এসে এমন এক আস্তানা বানাব আমরা, যেখানে ক্রমশ: মুছে যাবে লেখক ও পাঠকের বিস্তীর্ণ ব্যবধান। পাঠকই লেখক হবে, মিডিয়ার জগতে থাকবেনা কোন ব্যকরণশিক্ষক, ক্লাসরুমে থাকবেনা মিডিয়ার মাস্টারমশাইয়ের জন্য কোন বিশেষ প্ল্যাটফর্ম। এসব আদৌ হবে কিনা, গুরুচণ্ডালি টিকবে কিনা, সে পরের কথা, কিন্তু দু পা ফেলে দেখতে দোষ কী? ... আরও ...

আমাদের কথা
আপনি কি কম্পিউটার স্যাভি? সারাদিন মেশিনের সামনে বসে থেকে আপনার ঘাড়ে পিঠে কি স্পন্ডেলাইটিস আর চোখে পুরু অ্যান্টিগ্লেয়ার হাইপাওয়ার চশমা? এন্টার মেরে মেরে ডান হাতের কড়ি আঙুলে কি কড়া পড়ে গেছে? আপনি কি অন্তর্জালের গোলকধাঁধায় পথ হারাইয়াছেন? সাইট থেকে সাইটান্তরে বাঁদরলাফ দিয়ে দিয়ে আপনি কি ক্লান্ত? বিরাট অঙ্কের টেলিফোন বিল কি জীবন থেকে সব সুখ কেড়ে নিচ্ছে? আপনার দুশ্‌চিন্তার দিন শেষ হল। ... আরও ...

বুলবুলভাজা
এ হল ক্ষমতাহীনের মিডিয়া। গাঁয়ে মানেনা আপনি মোড়ল যখন নিজের ঢাক নিজে পেটায়, তখন তাকেই বলে হরিদাস পালের বুলবুলভাজা। পড়তে থাকুন রোজরোজ। দু-পয়সা দিতে পারেন আপনিও, কারণ ক্ষমতাহীন মানেই অক্ষম নয়। বুলবুলভাজায় বাছাই করা সম্পাদিত লেখা প্রকাশিত হয়। এখানে লেখা দিতে হলে লেখাটি ইমেইল করুন, বা, গুরুচন্ডা৯ ব্লগ (হরিদাস পাল) বা অন্য কোথাও লেখা থাকলে সেই ওয়েব ঠিকানা পাঠান (ইমেইল ঠিকানা পাতার নীচে আছে), অনুমোদিত এবং সম্পাদিত হলে লেখা এখানে প্রকাশিত হবে। ... আরও ...

হরিদাস পালেরা
এটি একটি খোলা পাতা, যাকে আমরা ব্লগ বলে থাকি। গুরুচন্ডালির সম্পাদকমন্ডলীর হস্তক্ষেপ ছাড়াই, স্বীকৃত ব্যবহারকারীরা এখানে নিজের লেখা লিখতে পারেন। সেটি গুরুচন্ডালি সাইটে দেখা যাবে। খুলে ফেলুন আপনার নিজের বাংলা ব্লগ, হয়ে উঠুন একমেবাদ্বিতীয়ম হরিদাস পাল, এ সুযোগ পাবেন না আর, দেখে যান নিজের চোখে...... আরও ...

টইপত্তর
নতুন কোনো বই পড়ছেন? সদ্য দেখা কোনো সিনেমা নিয়ে আলোচনার জায়গা খুঁজছেন? নতুন কোনো অ্যালবাম কানে লেগে আছে এখনও? সবাইকে জানান। এখনই। ভালো লাগলে হাত খুলে প্রশংসা করুন। খারাপ লাগলে চুটিয়ে গাল দিন। জ্ঞানের কথা বলার হলে গুরুগম্ভীর প্রবন্ধ ফাঁদুন। হাসুন কাঁদুন তক্কো করুন। স্রেফ এই কারণেই এই সাইটে আছে আমাদের বিভাগ টইপত্তর। ... আরও ...

ভাটিয়া৯
যে যা খুশি লিখবেন৷ লিখবেন এবং পোস্ট করবেন৷ তৎক্ষণাৎ তা উঠে যাবে এই পাতায়৷ এখানে এডিটিং এর রক্তচক্ষু নেই, সেন্সরশিপের ঝামেলা নেই৷ এখানে কোনো ভান নেই, সাজিয়ে গুছিয়ে লেখা তৈরি করার কোনো ঝকমারি নেই৷ সাজানো বাগান নয়, আসুন তৈরি করি ফুল ফল ও বুনো আগাছায় ভরে থাকা এক নিজস্ব চারণভূমি৷ আসুন, গড়ে তুলি এক আড়ালহীন কমিউনিটি ... আরও ...

ভূতের বেগার

গুরুচণ্ডা৯-র গ্রাহক হোন