https://www.facebook.com/share/p/194zGoho84/
จะเกิดอะไรขึ้น ถ้ามี 'สัตว์ประหลาด' ตัวหนึ่งกำลังไล่ 'เขมือบ' ข้อมูลทุกอย่างบนอินเทอร์เน็ต ทั้งบทความ วิกิพีเดีย หนังสือ หรือแม้แต่สเตตัสที่คุณเคยโพสต์ไว้เมื่อ 10 ปีก่อน?
...เรื่องนี้ไม่ใช่หนังสยองขวัญ แต่มันคือเบื้องหลังการสร้าง ChatGPT ครับ!
เรื่องนี้ต้องย้อนกลับไปที่จุดเริ่มต้นเลยครับ... ก่อนที่ ChatGPT จะฉลาดขนาดนี้ มันเป็นแค่โมเดลเปล่าๆ ที่ไม่มีความรู้อะไรเลย สิ่งแรกที่ทีมสร้างต้องทำคือ "หาอาหาร" ให้มันกิน ซึ่งอาหารของมันก็คือ "ข้อมูล" จำนวนมหาศาลนั่นเอง
พวกเขาทำสิ่งนี้ด้วยการส่งกองทัพที่เรียกว่า "Web Crawler" (ถ้าแปลแบบบ้านๆ ก็คือ 'หนอนเว็บ') ออกไปท่องอินเทอร์เน็ต เพื่อดูดข้อมูลทุกอย่างที่ขวางหน้ากลับมาให้หมด
ทีนี้คำว่า "มหาศาล" มันขนาดไหน?
ลองนึกภาพตามนะครับ...
[1] GPT-3 ถูกฝึกจากชุดข้อมูลที่ชื่อว่า Common Crawl ซึ่งรวบรวมข้อมูลเว็บมาเป็นเวลานานถึง 12 ปี
[2] ข้อมูลดิบที่เก็บมามีขนาดเป็น "เพตะไบต์" (Petabytes) หรือถ้าให้เห็นภาพคือประมาณ 1,000,000 Gigs!
[3] เฉพาะข้อมูลตัวอักษรที่ใช้ฝึก GPT-3 ก็ปาเข้าไป 45 เทราไบต์ ซึ่ง 1 เทราไบต์เนี่ย เทียบเท่ากับข้อความในหนังสือประมาณ 83 ล้านหน้าเลยนะครับ... คูณ 45 เข้าไปดูครับ!
แต่ข้อมูลที่สูบมามันก็เหมือนวัตถุดิบที่ยังไม่ได้ล้าง มีทั้งของดีของเน่าปนกันไปหมด ขั้นตอนต่อมาจึงเป็นการ "ล้างข้อมูล" (Data Preprocessing) คือการคัดกรอง เอาข้อมูลขยะออก เอาข้อมูลส่วนตัวที่อ่อนไหวทิ้งไป จนข้อมูลดิบมหาศาล ถูกกลั่นกรองลงมาเหลือแค่ 570GB ที่เป็นหัวกะทิคุณภาพสูงจริงๆ สำหรับเอาไปฝึก AI ต่อไป
สิ่งที่น่าสนใจของเคสนี้คือ... ความฉลาดของ AI มันไม่ได้มาจากโค้ดวิเศษหรืออัลกอริทึมลึกลับอะไรเลยครับ แต่มันมาจาก 'ความบ้าคลั่ง' ในการรวบรวมข้อมูลอย่างมหาศาล แล้วกลั่นกรองมันจนเหลือแต่หัวกะทิล้วนๆ
ที่เขาพูดกันว่า "Data is the new oil" หรือ "ข้อมูลคือขุมทรัพย์ใหม่" เนี่ย...เคสนี้คือบทพิสูจน์ที่ชัดที่สุดแล้วครับ AI ที่ไม่มีข้อมูลดีๆ ก็ไม่ต่างอะไรกับเครื่องยนต์ที่ไม่มีน้ำมัน มันวิ่งไม่ได้!
เมื่อรู้ว่าข้อมูลที่เราโพสต์ เราเขียน เราแชร์ อาจจะกลายเป็น 'อาหาร' ให้ AI เอาไปเรียนรู้... คุณรู้สึก 'ตื่นเต้น' กับอนาคต หรือ 'กังวล' เรื่องความเป็นส่วนตัวมากกว่ากันครับ? มาลองถกกันหน่อย!
#MewSocial #AI #ChatGPT #BigData #การตลาดดิจิทัล #DataCollection
ไม่มีความคิดเห็น:
แสดงความคิดเห็น