กว่า 20 ปีที่ Kit Loffstadt เขียนนิยายแฟนตาซีเกี่ยวกับจักรวาลอื่นสำหรับฮีโร่ “Star Wars” และวายร้าย “Buffy the Vampire Slayer” แบ่งปันเรื่องราวของเธอทางออนไลน์ฟรี
แต่ในเดือนพฤษภาคม Loffstadt หยุดโพสต์ผลงานของเธอหลังจากที่เธอรู้ว่าบริษัทข้อมูลได้คัดลอกเรื่องราวของเธอและส่งต่อไปยังเทคโนโลยีปัญญาประดิษฐ์ที่เป็นรากฐานของ ChatGPT ซึ่งเป็นแชทบ็อตไวรัส ด้วยความกลัว เธอซ่อนงานเขียนของเธอไว้หลังบัญชีที่ถูกล็อก
Loffstadt ยังได้ช่วยจัดกลุ่มกบฏต่อต้านระบบ AI เมื่อเดือนที่แล้ว เธอร่วมกับนักเขียนนิยายแฟนตาซีคนอื่นๆ อีกหลายสิบคน เผยแพร่เรื่องราวที่ไม่เคารพอย่างท่วมท้นทางออนไลน์เพื่อครอบงำและสร้างความสับสนให้กับบริการรวบรวมข้อมูลที่ป้อนงานของนักเขียนเข้าสู่เทคโนโลยี AI
“เราแต่ละคนต้องทำทุกวิถีทางเพื่อแสดงให้พวกเขาเห็นว่าผลงานสร้างสรรค์ของเราไม่ใช่เครื่องจักรที่จะเก็บเกี่ยวได้ตามต้องการ” ลอฟสตัดท์ นักพากย์วัย 42 ปีจากเซาท์ยอร์กเชียร์ในอังกฤษกล่าว
นักเขียนนิยายแฟนตาซีเป็นเพียงกลุ่มหนึ่งที่ตอนนี้แสดงการประท้วงต่อต้านระบบ AI เนื่องจากไข้เนื่องจากเทคโนโลยีได้เกาะกุมซิลิคอนแวลลีย์และโลก ในช่วงหลายเดือนที่ผ่านมา บริษัทสื่อสังคมออนไลน์อย่าง Reddit และ Twitter องค์กรข่าวอย่าง The New York Times และ NBC News นักเขียนอย่าง Paul Tremblay และดาราสาว Sarah Silverman ต่างก็แสดงจุดยืนต่อต้าน AI ที่ดูดข้อมูลของพวกเขาโดยไม่ได้รับอนุญาต
การประท้วงของพวกเขามีรูปแบบที่แตกต่างกัน นักเขียนและศิลปินกำลังล็อคไฟล์เพื่อปกป้องงานของพวกเขาหรือกำลังคว่ำบาตรเว็บไซต์บางแห่งที่เผยแพร่เนื้อหาที่สร้างโดย AI ในขณะที่บริษัทอย่าง Reddit ต้องการเรียกเก็บเงินสำหรับการเข้าถึงข้อมูลของพวกเขา มีการยื่นฟ้องบริษัท AI อย่างน้อย 10 คดีในปีนี้ โดยกล่าวหาว่าพวกเขาฝึกอบรมระบบเกี่ยวกับงานสร้างสรรค์ของศิลปินโดยไม่ได้รับความยินยอม สัปดาห์ที่ผ่านมา Ms. Silverman และผู้เขียน Christopher Golden และ Richard Kadrey ฟ้องร้อง OpenAI ผู้ผลิต ChatGPT และคนอื่นๆ เกี่ยวกับการที่ AI ใช้งานของพวกเขา
หัวใจของการก่อการกบฏคือความเข้าใจใหม่ที่ค้นพบว่าข้อมูลออนไลน์ เช่น เรื่องราว งานศิลปะ บทความข่าว โพสต์บนกระดานข้อความ และภาพถ่าย อาจมีคุณค่าที่ไม่ได้ใช้อย่างมีนัยสำคัญ
คลื่นลูกใหม่ของ AI หรือที่เรียกว่า “generative AI” สำหรับข้อความ รูปภาพ และเนื้อหาอื่นๆ ที่สร้างขึ้นนั้นถูกสร้างขึ้นบนระบบที่ซับซ้อน เช่น โมเดลภาษาขนาดใหญ่ ซึ่งสามารถสร้างร้อยแก้วที่เหมือนมนุษย์ได้ แบบจำลองเหล่านี้ได้รับการฝึกฝนในการรวบรวมข้อมูลทุกประเภทเพื่อให้สามารถตอบคำถามของผู้คน เลียนแบบรูปแบบการเขียน หรือล้อเลียนเรื่องขบขันและบทกวี
นั่นทำให้บริษัทเทคโนโลยีตามล่าหาข้อมูลมากขึ้นเพื่อป้อนระบบ AI ของพวกเขา Google, Meta และ OpenAI ได้ใช้ข้อมูลจากอินเทอร์เน็ตเป็นหลัก รวมถึงฐานข้อมูลขนาดใหญ่ของแฟนฟิก บทความข่าว และคอลเลกชั่นหนังสือ ซึ่งส่วนใหญ่มีให้บริการออนไลน์ฟรี ในวงการเทคโนโลยี เรียกสิ่งนี้ว่า “scraping” อินเทอร์เน็ต
GPT-3 ของ OpenAI ซึ่งเป็นระบบ AI ที่เปิดตัวในปี 2020 ครอบคลุม “โทเค็น” 500 พันล้านรายการ ซึ่งแต่ละรายการเป็นตัวแทนของคำต่างๆ ที่พบทางออนไลน์เป็นส่วนใหญ่ AI บางรุ่นครอบคลุมมากกว่าหนึ่งล้านล้านโทเค็น
แนวทางปฏิบัติในการขูดข้อมูลอินเทอร์เน็ตมีมาอย่างยาวนานและได้รับการเปิดเผยโดยบริษัทและองค์กรไม่แสวงหากำไรที่ดำเนินการดังกล่าวเป็นส่วนใหญ่ แต่บริษัทที่เป็นเจ้าของข้อมูลไม่เข้าใจหรือมองว่าเป็นปัญหาอย่างยิ่ง สิ่งนี้เปลี่ยนไปหลังจาก ChatGPT เปิดตัวในเดือนพฤศจิกายน และสาธารณชนได้เรียนรู้เพิ่มเติมเกี่ยวกับโมเดล AI พื้นฐานที่ขับเคลื่อนแชทบอท
Brandon Duderstadt ผู้ก่อตั้งและประธานเจ้าหน้าที่บริหารของ Nomic บริษัทด้าน AI กล่าวว่า “สิ่งที่เกิดขึ้นที่นี่คือการปรับเปลี่ยนพื้นฐานของมูลค่าของข้อมูล “ก่อนหน้านี้ ความคิดคือการที่คุณได้รับคุณค่าจากข้อมูลโดยการเปิดให้ทุกคนและแสดงโฆษณา ตอนนี้ ความคิดคือการที่คุณล็อกข้อมูลของคุณ เพราะคุณสามารถดึงค่าได้มากขึ้นเมื่อคุณใช้เป็นข้อมูลป้อนเข้าสู่ AI ของคุณ”
การประท้วงข้อมูลอาจมีผลเพียงเล็กน้อยในระยะยาว ยักษ์ใหญ่ด้านเทคโนโลยีที่มีกระเป๋าลึกเช่น Google และ Microsoft นั้นมีข้อมูลที่เป็นกรรมสิทธิ์อยู่แล้วและมีทรัพยากรในการออกใบอนุญาตเพิ่มเติม แต่เมื่อยุคของเนื้อหาที่ง่ายต่อการขูดใกล้เข้ามา องค์กร AI ขนาดเล็กและองค์กรไม่แสวงหาผลกำไรที่หวังจะแข่งขันกับบริษัทขนาดใหญ่อาจไม่ได้รับเนื้อหาเพียงพอสำหรับการฝึกอบรมระบบของตน
ในแถลงการณ์ OpenAI กล่าวว่า ChatGPT ได้รับการฝึกอบรมเกี่ยวกับ “เนื้อหาที่ได้รับอนุญาต เนื้อหาที่เปิดเผยต่อสาธารณะ และเนื้อหาที่สร้างโดยผู้ฝึกสอน AI ที่เป็นมนุษย์” กล่าวเสริมว่า “เราเคารพในสิทธิ์ของผู้สร้างและผู้แต่ง และหวังว่าจะได้ทำงานร่วมกับพวกเขาต่อไปเพื่อปกป้องผลประโยชน์ของพวกเขา”
Google กล่าวในแถลงการณ์ว่ามีส่วนร่วมในการพูดคุยเกี่ยวกับวิธีที่ผู้เผยแพร่สามารถจัดการเนื้อหาของตนได้ในอนาคต “เราเชื่อว่าทุกคนได้รับประโยชน์จากระบบนิเวศของเนื้อหาที่มีชีวิตชีวา” บริษัทกล่าว Microsoft ไม่ตอบสนองต่อคำร้องขอความคิดเห็น
การปฏิวัติข้อมูลปะทุขึ้นเมื่อปีที่แล้วหลังจากที่ ChatGPT กลายเป็นปรากฏการณ์ไปทั่วโลก ในเดือนพฤศจิกายน กลุ่มโปรแกรมเมอร์ ยื่นฟ้องคดีแบบกลุ่ม ต่อ Microsoft และ OpenAI โดยอ้างว่าบริษัทเหล่านี้ละเมิดลิขสิทธิ์หลังจากรหัสของพวกเขาถูกใช้เพื่อฝึกอบรมผู้ช่วยเขียนโปรแกรมที่ขับเคลื่อนด้วย AI
ในเดือนมกราคม Getty Images ซึ่งให้บริการภาพถ่ายสต็อกและวิดีโอ ฟ้อง Stability AI ซึ่งเป็นบริษัท AI ที่สร้างรูปภาพจากคำอธิบายข้อความ โดยอ้างว่าบริษัทสตาร์ทอัพใช้ภาพถ่ายที่มีลิขสิทธิ์ในการฝึกอบรมระบบของตน
จากนั้นในเดือนมิถุนายน Clarkson สำนักงานกฎหมายในลอสแองเจลิสได้ยื่นฟ้องคดีแบบกลุ่มที่เสนอ 151 หน้าต่อ OpenAI และ Microsoft โดยอธิบายว่า OpenAI รวบรวมข้อมูลจากผู้เยาว์อย่างไร และการขูดเว็บละเมิดกฎหมายลิขสิทธิ์และถือเป็น “การโจรกรรม” เมื่อวันอังคาร บริษัทได้ยื่นฟ้อง Google ที่คล้ายกัน
“การจลาจลด้านข้อมูลที่เราพบเห็นทั่วประเทศเป็นวิถีทางของสังคมในการผลักดันแนวคิดนี้ว่า Big Tech มีสิทธิ์เพียงนำข้อมูลใดๆ และทั้งหมดจากแหล่งใดก็ตามมาสร้างเป็นของตนเอง” Ryan Clarkson กล่าว ผู้ก่อตั้งคลาร์กสัน
เอริก โกลด์แมน ศาสตราจารย์แห่งคณะนิติศาสตร์มหาวิทยาลัยซานตาคลารา กล่าวว่า ข้อโต้แย้งของคดีความนั้นกว้างขวางและไม่น่าจะได้รับการยอมรับจากศาล แต่กระแสการฟ้องร้องเพิ่งเริ่มต้น เขากล่าว พร้อมกับ “ระลอกที่สองและสาม” ที่จะกำหนดอนาคตของ AI
บริษัทขนาดใหญ่ก็ต่อต้าน AI Scraper ด้วยเช่นกัน ในเดือนเมษายน Reddit กล่าวว่าต้องการเรียกเก็บเงินสำหรับการเข้าถึงส่วนต่อประสานการเขียนโปรแกรมแอปพลิเคชันหรือ API ซึ่งเป็นวิธีการที่บุคคลที่สามสามารถดาวน์โหลดและวิเคราะห์ฐานข้อมูลขนาดใหญ่ของโซเชียลเน็ตเวิร์กของการสนทนาแบบตัวต่อตัว
Steve Huffman ประธานเจ้าหน้าที่บริหารของ Reddit กล่าวในตอนนั้นว่าบริษัทของเขาไม่จำเป็นต้อง “ให้มูลค่าทั้งหมดนั้นแก่บริษัทที่ใหญ่ที่สุดในโลกบางแห่งแบบฟรีๆ”
ในเดือนเดียวกันนั้น Stack Overflow ซึ่งเป็นไซต์ถามและตอบสำหรับโปรแกรมเมอร์คอมพิวเตอร์กล่าวว่าจะขอให้บริษัท AI จ่ายค่าข้อมูลด้วย เว็บไซต์มีคำถามและคำตอบเกือบ 60 ล้านข้อ มีการรายงานความเคลื่อนไหวก่อนหน้านี้ โดย สาย.
องค์กรข่าวยังต่อต้านระบบ AI ในบันทึกภายในเกี่ยวกับการใช้ generative AI ในเดือนมิถุนายน The Times กล่าวว่า บริษัท AI ควร “เคารพทรัพย์สินทางปัญญาของเรา” โฆษกของ Times ปฏิเสธที่จะให้รายละเอียดเพิ่มเติม
สำหรับศิลปินและนักเขียนแต่ละคน การต่อสู้กับระบบ AI หมายถึงการคิดใหม่ว่าจะเผยแพร่ที่ไหน
Nicholas Kole วัย 35 ปี นักวาดภาพประกอบในเมืองแวนคูเวอร์ รัฐบริติชโคลัมเบีย รู้สึกตื่นตระหนกกับรูปแบบศิลปะที่แตกต่างของเขาที่สามารถจำลองโดยระบบ AI และสงสัยว่าเทคโนโลยีดังกล่าวได้คัดลอกผลงานของเขา เขาวางแผนที่จะโพสต์ผลงานสร้างสรรค์ของเขาบน Instagram, Twitter และเว็บไซต์โซเชียลมีเดียอื่นๆ เพื่อดึงดูดลูกค้า แต่เขาหยุดเผยแพร่บนเว็บไซต์อย่าง ArtStation ที่โพสต์เนื้อหาที่สร้างโดย AI ควบคู่ไปกับเนื้อหาที่มนุษย์สร้างขึ้น
“มันให้ความรู้สึกเหมือนถูกขโมยไปจากผมและศิลปินคนอื่นๆ” นายโคเลกล่าว “มันทำให้ฉันรู้สึกหวาดกลัวอยู่ในท้องของฉัน”
ที่ Archive of Our Own ซึ่งเป็นฐานข้อมูลแฟนฟิคที่มีเรื่องราวมากกว่า 11 ล้านเรื่อง นักเขียนได้กดดันไซต์ให้แบนการขูดข้อมูลและเรื่องราวที่สร้างโดย AI มากขึ้น
ในเดือนพฤษภาคม เมื่อบัญชี Twitter บางบัญชีแชร์ตัวอย่าง ChatGPT ที่เลียนแบบสไตล์แฟนฟิคยอดนิยมที่โพสต์บน Archive of Our Own นักเขียนหลายสิบคนก็ลุกขึ้นมา พวกเขาบล็อกเรื่องราวของพวกเขาและเขียนเนื้อหาที่ล้มล้างเพื่อทำให้ AI เข้าใจผิด พวกเขายังผลักดันให้ผู้นำของ Archive of Our Own หยุดอนุญาตเนื้อหาที่สร้างโดย AI
Betsy Rosenblatt ผู้ให้คำแนะนำด้านกฎหมายแก่ Archive of Our Own และเป็นศาสตราจารย์ที่ University of Tulsa College of Law กล่าวว่าเว็บไซต์นี้มีนโยบาย “ครอบคลุมสูงสุด” และไม่ต้องการอยู่ในตำแหน่งที่แยกแยะได้ว่าเรื่องราวใดถูกเขียนขึ้น ด้วย AI
สำหรับคุณ Loffstadt นักเขียนนิยายแฟนตาซี การต่อสู้กับ AI เกิดขึ้นขณะที่เธอเขียนเรื่องราวเกี่ยวกับ “Horizon Zero Dawn” วิดีโอเกมที่มนุษย์ต่อสู้กับหุ่นยนต์ที่ขับเคลื่อนด้วย AI ในโลกหลังหายนะ ในเกม เธอกล่าวว่า หุ่นยนต์บางตัวนั้นดีและบางตัวก็แย่
แต่ในโลกแห่งความเป็นจริง เธอกล่าวว่า “ต้องขอบคุณความโอหังและความโลภขององค์กร พวกเขาจึงถูกชักจูงให้ทำสิ่งเลวร้าย”