ข้อผิดพลาดสี่ประการของความแม่นยำในการวิเคราะห์ความเชื่อมั่น
เผยแพร่แล้ว: 2022-03-11ผู้คนใช้ฟอรัม โซเชียลเน็ตเวิร์ก บล็อก และแพลตฟอร์มอื่นๆ เพื่อแชร์ความคิดเห็น ดังนั้นจึงสร้างข้อมูลจำนวนมหาศาล ในขณะเดียวกัน ผู้ใช้หรือผู้บริโภคต้องการทราบว่าควรซื้อผลิตภัณฑ์ใดหรือดูภาพยนตร์เรื่องใด ดังนั้นพวกเขาจึงอ่านบทวิจารณ์และพยายามตัดสินใจตามนั้น
การรวบรวมข้อมูลเกี่ยวกับข้อมูลที่ผู้ใช้สร้างขึ้นด้วยตนเองนั้นใช้เวลานาน นั่นเป็นสาเหตุที่บริษัทและองค์กรต่างๆ สนใจวิธีวิเคราะห์ความเชื่อมั่นอัตโนมัติเพื่อช่วยให้พวกเขาเข้าใจมากขึ้น
การวิเคราะห์ความเชื่อมั่นคืออะไร?
การวิเคราะห์ความรู้สึกเป็นกระบวนการศึกษาความคิดเห็นและอารมณ์ของผู้คน โดยทั่วไปจะใช้เงื่อนงำภาษา เมื่อมองแวบแรก มันเป็นเพียงปัญหาการจัดประเภทข้อความ แต่ถ้าเราเจาะลึกลงไป เราจะพบว่ามีปัญหาที่ท้าทายมากมายที่ส่งผลกระทบอย่างจริงจังต่อความถูกต้องของการวิเคราะห์ความรู้สึก ด้านล่างนี้ ฉันจะสำรวจข้อผิดพลาดบางอย่างที่คุณต้องเผชิญกับปัญหาการวิเคราะห์ความเชื่อมั่นทั่วไป:
- ประชดและเสียดสี
- ประเภทของการปฏิเสธ
- ความคลุมเครือของคำ
- หลายขั้ว
เราจะพูดถึงแต่ละหัวข้อและพยายามทำความเข้าใจว่าปัญหาที่อธิบายไว้ส่งผลต่อคุณภาพของตัวแยกประเภทความรู้สึกอย่างไร และเทคโนโลยีใดบ้างที่สามารถนำมาใช้แก้ปัญหาได้
ความท้าทายในการวิเคราะห์ความเชื่อมั่นครั้งที่ 1: การตรวจจับการเสียดสี
ในข้อความประชดประชัน ผู้คนแสดงความรู้สึกเชิงลบโดยใช้คำพูดเชิงบวก ข้อเท็จจริงนี้ทำให้การเสียดสีสามารถโกงแบบจำลองการวิเคราะห์ความรู้สึกได้อย่างง่ายดาย เว้นแต่ว่าได้รับการออกแบบมาโดยเฉพาะเพื่อคำนึงถึงความเป็นไปได้
การเสียดสีเกิดขึ้นบ่อยที่สุดในเนื้อหาที่ผู้ใช้สร้างขึ้น เช่น ความคิดเห็นบน Facebook ทวีต ฯลฯ การตรวจจับการเสียดสีในการวิเคราะห์ความรู้สึกเป็นเรื่องยากมากที่จะทำสำเร็จโดยปราศจากความเข้าใจที่ดีเกี่ยวกับบริบทของสถานการณ์ หัวข้อเฉพาะ และสิ่งแวดล้อม
อาจเป็นเรื่องยากที่จะเข้าใจ ไม่เพียงแต่สำหรับเครื่องจักรแต่สำหรับมนุษย์ด้วย ความผันแปรอย่างต่อเนื่องของคำที่ใช้ในประโยคประชดประชันทำให้ยากต่อการฝึกแบบจำลองการวิเคราะห์ความรู้สึกให้สำเร็จ หัวข้อทั่วไป ความสนใจ และข้อมูลทางประวัติศาสตร์จะต้องแบ่งปันกันระหว่างคนสองคนเพื่อให้เกิดการเสียดสี
อันดับแรก มาดูการเสียดสีจากมุมมองของ ภาษาศาสตร์ ซึ่งมีการศึกษาการเสียดสีกันอย่างกว้างขวาง ในงานวิจัยที่มีผู้อ้างอิงมากที่สุดชิ้นหนึ่งในสาขานี้ ผู้เขียน Elisabeth Camp เสนอการเสียดสีสี่ประเภทต่อไปนี้:
- ประพจน์: การเสียดสีดูเหมือนจะเป็นข้อเสนอที่ไม่ใช่อารมณ์ แต่มีความรู้สึกโดยปริยายที่เกี่ยวข้อง
- เอ็มเบ็ดเด็ด: การเสียดสีมีความรู้สึกไม่ลงรอยกันที่ฝังแน่นอยู่ในรูปแบบของคำและวลีเอง
- คำนำหน้าเหมือน: วลีที่คล้ายกันให้การปฏิเสธโดยนัยของการโต้แย้งที่กำลังเกิดขึ้น
- การล้อเลียน: การกระทำที่ไม่ใช่คำพูด (ภาษากาย ท่าทาง) ที่นำไปสู่การเสียดสี
งานวิจัยของแคมป์เผยแพร่ในปี 2555 ในปี 2560 นักวิจัยจากมหาวิทยาลัยสแตนฟอร์ดประกาศงานวิจัยที่น่าสนใจของตัวเองว่า “การมีเวลา 2 ชั่วโมงในการเขียนบทความเป็นเรื่องสนุก!”: การตรวจจับการเสียดสีในข้อความส่วนที่เป็นตัวเลข ซึ่งพวกเขาพูดถึงการเสียดสีประเภทอื่นที่เรียกว่า ตัวเลข การ เสียดสี การเสียดสีเชิงตัวเลขเกิดขึ้นบ่อยมากในเครือข่ายสังคมออนไลน์ แนวคิดเบื้องหลังมีความเกี่ยวข้องกับการเปลี่ยนแปลงค่าตัวเลขซึ่งจะส่งผลต่อขั้วของข้อความ ตัวอย่างเช่น:
- "โทรศัพท์เครื่องนี้มีแบตเตอรี่สำรองที่ยอดเยี่ยมถึง 38 ชั่วโมง" (ไม่ประชดประชัน)
- "โทรศัพท์เครื่องนี้มีแบตเตอรี่สำรองที่ยอดเยี่ยมถึง 2 ชั่วโมง" (ประชดประชัน)
- "ข้างนอกมัน +25 และฉันร้อนมาก" (ไม่ประชดประชัน)
- "ข้างนอกมัน -25 โมงแล้ว ฉันร้อนจัง" (ประชดประชัน)
- "เราขับช้ามาก---แค่ 20 กม./ชม." (ไม่ประชดประชัน)
- "เราขับช้ามาก -- เพียง 160 กม./ชม." (ประชดประชัน)
ดังที่เราเห็น ประโยคเหล่านี้แตกต่างกันในจำนวนที่ใช้เท่านั้น ดังนั้นจึงเป็นการเสียดสีเชิงตัวเลข
มีวิธีการต่างๆ ในการตรวจจับการเสียดสีโดยอัตโนมัติ รวมถึง:
- ตามกฎ
- สถิติ
- อัลกอริธึมการเรียนรู้ของเครื่อง
- การเรียนรู้อย่างลึกซึ้ง
แนวทางการเรียนรู้เชิงลึกกำลังได้รับความนิยม Kumar, Somani และ Bhattacharyya สรุปในปี 2017 ว่ารูปแบบการเรียนรู้เชิงลึกเฉพาะ (สถาปัตยกรรม CNN-LSTM-FF) มีประสิทธิภาพเหนือกว่าวิธีการแบบเดิม โดยมีระดับความแม่นยำสูงสุดสำหรับการตรวจจับการเสียดสีเชิงตัวเลข
แต่โครงข่ายประสาทเทียมเชิงลึก (DNN) ไม่เพียงแต่ดีที่สุดสำหรับการเสียดสีเชิงตัวเลขเท่านั้น แต่ยังมีประสิทธิภาพเหนือกว่าวิธีการตรวจจับการเสียดสีอื่นๆ โดยทั่วไปด้วย Ghosh และ Veale ในรายงานปี 2016 ของพวกเขาใช้การผสมผสานระหว่างโครงข่ายประสาทเทียม เครือข่ายหน่วยความจำระยะสั้น (LSTM) และ DNN พวกเขาเปรียบเทียบวิธีการของพวกเขากับเครื่องเวกเตอร์สนับสนุนแบบเรียกซ้ำ (SVM) และสรุปว่าสถาปัตยกรรมการเรียนรู้เชิงลึกของพวกเขาเป็นการปรับปรุงวิธีการดังกล่าว
ความท้าทายในการวิเคราะห์ความเชื่อมั่นครั้งที่ 2: การตรวจจับการปฏิเสธ
ในภาษาศาสตร์ การปฏิเสธเป็นวิธีการกลับขั้วของคำ วลี และแม้แต่ประโยค นักวิจัยใช้กฎทางภาษาที่แตกต่างกันเพื่อระบุว่าเกิดการปฏิเสธหรือไม่ แต่สิ่งสำคัญคือต้องกำหนดช่วงของคำที่ได้รับผลกระทบจากคำปฏิเสธ

ไม่มีขนาดคงที่สำหรับขอบเขตของคำที่ได้รับผลกระทบ ตัวอย่างเช่น ในประโยค “การแสดงไม่น่าสนใจ” ขอบเขตเป็นเพียงคำถัดไปหลังคำปฏิเสธเท่านั้น แต่สำหรับประโยคอย่าง “ฉันไม่เรียกหนังเรื่องนี้ว่าหนังตลก” ผลของคำปฏิเสธว่า “ไม่” จะอยู่จนจบประโยค ความหมายดั้งเดิมของคำจะเปลี่ยนไปหากคำบวกหรือลบอยู่ในขอบเขตของการปฏิเสธ—ในกรณีนั้น ขั้วตรงข้ามจะถูกส่งกลับ
แนวทางที่ง่ายที่สุดในการจัดการกับการปฏิเสธในประโยค ซึ่งใช้ในเทคนิคการวิเคราะห์ความรู้สึกที่ล้ำสมัยส่วนใหญ่ คือการทำเครื่องหมายว่าเป็นการปฏิเสธคำทั้งหมดจากสัญญาณปฏิเสธไปยังโทเค็นเครื่องหมายวรรคตอนถัดไป ประสิทธิภาพของรูปแบบการปฏิเสธสามารถเปลี่ยนแปลงได้เนื่องจากการสร้างภาษาเฉพาะในบริบทที่แตกต่างกัน
มีหลายรูปแบบในการแสดงความคิดเห็นเชิงลบในประโยค:
- การปฏิเสธสามารถมีลักษณะทางสัณฐานวิทยาโดยที่คำนำหน้า ("dis-", "non-") หรือคำต่อท้าย ("-less")
- การปฏิเสธสามารถบอกเป็นนัยได้ เช่นเดียวกับใน “การกระทำนี้ มันจะเป็นภาพยนตร์เรื่องแรกและเรื่องสุดท้ายของเขา”—มันมีความรู้สึกเชิงลบ แต่ไม่มีการใช้คำเชิงลบ
- การปฏิเสธสามารถชัดเจนได้เช่นเดียวกับใน "สิ่งนี้ไม่ดี"
การมีตัวอย่างที่มีการอธิบายปฏิเสธประเภทต่างๆ จะเพิ่มคุณภาพของชุดข้อมูลสำหรับการฝึกอบรมและการทดสอบแบบจำลองการจัดประเภทความรู้สึกภายในการปฏิเสธ จากการวิจัยล่าสุดเกี่ยวกับโครงข่ายประสาทเทียมแบบเกิดซ้ำ (RNNs) สถาปัตยกรรมต่างๆ ของแบบจำลอง LSTM มี ประสิทธิภาพเหนือกว่าแนวทางอื่นๆ ทั้งหมดในการตรวจหาประเภทของการปฏิเสธในประโยค
ในรายงาน Effect of Negation in Sentiment Analysis โมเดลการวิเคราะห์ความคิดเห็นได้ประเมินบทวิจารณ์ 500 รายการซึ่งรวบรวมจาก Amazon และ Trustedreviews.com ผู้เขียนแสดงการเปรียบเทียบแบบจำลองที่มีและไม่มีการตรวจจับการปฏิเสธ การประเมินของพวกเขาแสดงให้เห็นว่าการพิจารณาการปฏิเสธสามารถเพิ่มความแม่นยำของแบบจำลองได้อย่างไร
ความท้าทายในการวิเคราะห์ความเชื่อมั่นครั้งที่ 3: ความคลุมเครือของคำ
ความกำกวมของคำเป็นหลุมพรางอีกอย่างหนึ่งที่คุณจะต้องเผชิญกับปัญหาการวิเคราะห์ความเชื่อมั่น ปัญหาของความกำกวมของคำคือความเป็นไปไม่ได้ที่จะกำหนดความเป็นขั้วไว้ล่วงหน้า เพราะความคลุมเครือของคำบางคำขึ้นอยู่กับบริบทของประโยคเป็นอย่างมาก
วิธีวิเคราะห์ความรู้สึกตามพจนานุกรมเป็นที่นิยมในหมู่วิธีการที่มีอยู่ พจนานุกรมความคิดเห็นประกอบด้วยคำแสดงความคิดเห็นที่มีค่าความเป็นขั้ว มีคำศัพท์เกี่ยวกับความคิดเห็นสาธารณะอยู่บ้างบนอินเทอร์เน็ต: SentiWordNet, General Inquirer และ SenticNet เป็นต้น เนื่องจากคำศัพท์แต่ละขั้วจะแตกต่างกันออกไปในแต่ละโดเมน จึงเป็นไปไม่ได้ที่จะพัฒนาพจนานุกรมความคิดเห็นสากลที่มีรูปแบบขั้วสำหรับทุกคำ ตัวอย่างเช่น:
- “เรื่องราวเป็นสิ่งที่คาดเดาไม่ได้”
- “พวงมาลัยคาดเดาไม่ได้”
สองตัวอย่างนี้แสดงให้เห็นว่าบริบทส่งผลต่อความรู้สึกความคิดเห็นอย่างไร ในตัวอย่างแรก คำว่าขั้วของ "คาดเดาไม่ได้" จะถูกคาดการณ์ว่าเป็นบวก ในวินาที ขั้วของคำเดียวกันนั้นเป็นลบ
ความท้าทายในการวิเคราะห์ความเชื่อมั่นครั้งที่ 4: ภาวะหลายขั้ว
บางครั้ง ประโยคหรือเอกสารที่กำหนด หรือหน่วยข้อความใดก็ตามที่เราต้องการวิเคราะห์ จะแสดงภาวะหลายขั้ว ในกรณีเหล่านี้ การมีเพียงผลรวมของการวิเคราะห์อาจทำให้เข้าใจผิดได้ เช่นเดียวกับที่บางครั้งค่าเฉลี่ยสามารถซ่อนข้อมูลอันมีค่าเกี่ยวกับตัวเลขทั้งหมดที่ป้อนเข้าไปได้
รูปภาพเมื่อผู้เขียนพูดถึงบุคคล ผลิตภัณฑ์ หรือบริษัทต่างๆ (หรือแง่มุมต่างๆ ของพวกเขา) ในบทความหรือบทวิจารณ์ เป็นเรื่องปกติที่เนื้อหาบางเรื่องจะถูกวิพากษ์วิจารณ์และยกย่องในบางส่วน
ที่นี่ ขั้วของความเชื่อมั่นทั้งหมดจะไม่มีข้อมูลสำคัญ ด้วยเหตุนี้จึงจำเป็นต้องแยกเอนทิตีหรือแง่มุมทั้งหมดในประโยคด้วยป้ายกำกับความรู้สึกที่กำหนด และคำนวณเฉพาะขั้วทั้งหมดหากจำเป็น
ลองมาพิจารณาตัวอย่างที่ประกอบด้วยขั้วหลายขั้ว: “คุณภาพเสียงของแล็ปท็อปเครื่องใหม่ของฉันนั้นเจ๋งมาก แต่สีของจอแสดงผลยังไม่ค่อยดีนัก”
แบบจำลองการวิเคราะห์ความรู้สึกบางตัวจะกำหนดขั้วลบหรือขั้วที่เป็นกลางให้กับประโยคนี้ ในการจัดการกับสถานการณ์ดังกล่าว โมเดลการวิเคราะห์ความรู้สึกต้องกำหนดขั้วให้กับแต่ละแง่มุมในประโยค ในที่นี้ "เสียง" เป็นลักษณะที่กำหนดขั้วบวกและ "การแสดงผล" เป็นลักษณะที่แยกจากกันโดยมีขั้วลบ
สำหรับคำอธิบายเชิงลึกของแนวทางนี้ ผมขอแนะนำบทความที่น่าสนใจและมีประโยชน์สำหรับ Deep Learning for Aspect-based Sentiment Analysis โดย Bo Wanf และ Min Liu จากมหาวิทยาลัยสแตนฟอร์ด
การปรับปรุงความแม่นยำในการวิเคราะห์ความเชื่อมั่น: นี่ไม่ใช่กรณีพิเศษ
ในบทความนี้ เราได้พูดถึงปัญหาที่นิยมในการจัดประเภทการวิเคราะห์ความเชื่อมั่น: การเสียดสี การปฏิเสธ ความกำกวมของคำ และภาวะหลายขั้ว การรู้เกี่ยวกับสิ่งเหล่านี้จะช่วยให้คุณหลีกเลี่ยงปัญหาที่อาจเกิดขึ้นได้: การพิจารณาสถานการณ์ที่เราได้พูดคุยกันจะช่วยเพิ่มความแม่นยำในการวิเคราะห์ความรู้สึกในแบบจำลองการจัดหมวดหมู่ได้อย่างมาก ฉันหวังว่าคุณจะพบบทความนี้เป็นการแนะนำหัวข้อที่เป็นประโยชน์