NEWS UPDATE • SPECIAL ARTICLE

ความน่าสนใจในการวิเคราะห์ข้อมูลตัวอักษรจาก MD&A ของบริษัทจดทะเบียนไทย

ข้อมูลเป็นสิ่งสำคัญในธุรกิจตลาดทุนโดยเฉพาะข้อมูลที่เกี่ยวกับผลการดำเนินงานของบริษัทจดทะเบียน เนื่องจากราคาหุ้นของบริษัทมักแปรผันสอดคล้องกับการคาดการณ์ของกำไรในอนาคต อย่างไรก็ดีข้อมูลที่ถูกจัดเก็บและบันทึกไว้ในรูปแบบดิจิทัลทั้งข้อมูลตัวเลขและตัวอักษรมีปริมาณเพิ่มขึ้นอย่างต่อเนื่อง

ในปัจจุบันเนื่องจากความก้าวหน้าทางเทคโนโลยีทำให้เราสามารถใช้เครื่องมือใหม่ๆ เช่น AI และ machine learning มาช่วยวิเคราะห์และจัดการกับข้อมูลขนาดใหญ่ (big data) เหล่านี้ โดยสามารถวิเคราะห์ข้อมูลที่เป็นตัวอักษร (textual analysis) ได้ ในตลาดทุนต่างประเทศมีการนำข้อมูลตัวอักษรมาวิเคราะห์และพัฒนามาเป็นระยะเวลาพอสมควรแล้วทั้งในทางวิชาการและใช้งานจริงในภาคธุรกิจ 


อย่างไรก็ตาม การศึกษาด้าน textual analysis ในตลาดทุนไทยยังคงมีจำนวนจำกัดสาเหตุมาจากการตัดคำ (tokenization) สำหรับภาษาไทยยังไม่สมบูรณ์ อีกทั้งพจนานุกรม (dictionary) ที่จะใช้กำหนดว่าคำไหนมีความหมายเชิงบวกหรือลบในทางการเงินยังไม่มีการศึกษาอย่างกว้างขวางเหมือนในต่างประเทศ และหากจะใช้ข้อมูลของบริษัทจดทะเบียนที่เป็นภาษาอังกฤษยังมีข้อจำกัดเนื่องจากมีข้อมูลค่อนข้างน้อยและกระจัดกระจาย

งานวิจัยชิ้นนี้ได้รวบรวมแหล่งข้อมูลเอกสารที่เปิดเผยข้อมูลผลการดำเนินงาน (financial disclosure) ของบริษัทจดทะเบียนใน SET และ mai ที่เป็นภาษาอังกฤษอย่างต่อเนื่องตั้งแต่ปี 2012 – 2018 และใช้เทคนิคด้าน machine learning ในการสกัดข้อมูลที่บอกถึงหัวข้อหลักที่ผู้บริหารใช้ในเอกสารคำอธิบายและการวิเคราะห์ของฝ่ายจัดการ (MD&A) ของ 49 บริษัทจดทะเบียน รวมกว่า 1,400 ฉบับ จากนั้นเขียนโปรแกรมคอมพิวเตอร์ให้วิเคราะห์หาความรู้สึกหรือทัศนคติของผู้เขียนจากการถ่ายทอดทางข้อความตัวอักษร (textual sentiment) เพื่อหาว่าในแต่ละหัวข้อนั้นผู้บริหารสื่อสาร MD&A ในเชิงบวกหรือลบ

ผลการศึกษาพบว่าเทคนิคด้าน machine learning ที่เคยถูกนำมาใช้ในตลาดประเทศพัฒนาแล้วสามารถจำแนกหัวข้อในเอกสาร MD&A ไทยได้อย่างมีประสิทธิภาพ โดยผู้บริหารส่วนใหญ่กล่าวถึง 4 หัวข้อหลักด้วยสัดส่วนดังต่อไปนี้

         1) financial performance (23%)

         2) financial status (21%)

         3) external factor (13%) และ

         4) industry specific (43%)

นอกจากนี้ ผลการศึกษายังมีข้อสรุปที่คล้ายคลึงกับงานวิจัยในต่างประเทศ โดยพบว่าเอกสาร MD&A มีข้อมูลสำคัญแอบแฝงอยู่ซึ่งหากผู้ลงทุนสามารถนำไปใช้ประกอบการตัดสินใจลงทุนจะสามารถสร้างผลตอบแทนที่สูงกว่าตลาดได้

การศึกษานี้ยังเป็นจุดเริ่มต้นซึ่งทำให้ได้เข้าใจเกี่ยวกับพฤติกรรมการตอบสนองจากข้อมูลของผู้ลงทุนในเชิงลึกมากยิ่งขึ้น อาทิเช่น ผู้ลงทุนตอบสนองข้อมูลในเชิงบวกและเชิงลบไม่เท่ากันโดยผู้ลงทุนนั้นให้ความสำคัญกับข้อมูลในเชิงลบมากกว่า อีกทั้งผู้ลงทุนยังให้คุณค่ากับ textual sentiment ในหัวข้ออื่นๆ นอกจากหัวข้อ firm’s financial performance อีกด้วย และหลายหุ้นของบริษัทที่เผยแพร่เอกสาร MD&A ออกมาในเชิงบวกยังสามารถทำให้ความผันผวนของราคาลดลง สำหรับรายละเอียดเพิ่มเติมสามารถหาอ่านได้ที่ https://www.set.or.th/th/setresearch/research/working_paper.html

จากความก้าวหน้าด้านเทคโนโลยีทำให้มีนวัตกรรมใหม่ๆ ในตลาดทุนเกิดขึ้นมากมาย เช่น fintech, algorithm trading, cryptocurrency และ robo-advisor ซึ่งนวัตกรรมเหล่านี้ทำให้ ecosystem ในตลาดทุน รวมถึงพฤติกรรมของผู้ลงทุนมีการปรับเปลี่ยนไป ยิ่งผู้ลงทุนหันไปทำธุรกรรมบนโลกดิจิทัลเพิ่มมากขึ้น ยิ่งทำให้ปริมาณของข้อมูลที่ถูกจัดเก็บไว้นั้นมีขนาดใหญ่หรือที่เรียกว่า “big data” ซึ่งนอกจากข้อมูลในลักษณะที่เป็นตัวเลขที่นักวิเคราะห์มีความคุ้นเคยในการนำมาทำการศึกษาเท่านั้น ปัจจุบันยังมีข้อมูลที่มีลักษณะเป็นตัวอักษร ภาพถ่าย คลิปเสียง และแม้แต่คลิปวิดีโอยังถูกจัดเก็บไว้และสามารถนำมาทำการศึกษาได้เช่นกัน

อย่างไรก็ดีการศึกษาหรือหารูปแบบของ big data นั้นต้องอาศัยเครื่องมือที่ชาญฉลาด สามารถประมวลผลและรายงานได้อย่างรวดเร็ว ซึ่งในอดีตอาจต้องพึ่งพาวิศวกรหรือนักพัฒนาโปรแกรมที่มีทักษะด้านคอมพิวเตอร์มาช่วยทำการศึกษา แต่โชคดีที่ทุกวันนี้มีซอฟท์แวร์ที่มีลักษณะเป็น open source ซึ่งเปิดโอกาสให้ผู้มีความเชี่ยวชาญในด้านต่างๆ สามารถมาร่วมกันพัฒนาชุดคำสั่งหรือ algorithm ให้สามารถใช้งานง่ายขึ้นโดยไม่มีค่าใช้จ่ายอีกด้วย ทำให้การพัฒนางานวิจัยโดยใช้ big data ในด้านต่างๆ รวมถึงตลาดทุนเป็นไปอย่างแพร่หลายในระยะเวลาอันสั้น นอกจากนี้ในด้านการนำเสนอผลงาน นักวิจัยควรคำนึงถึงการสื่อสารที่มีประสิทธิภาพ โดยการหาวิธีนำเสนอที่น่าสนใจผ่านช่องทางที่สามารถเข้าถึงคนจำนวนมากเพื่อเพิ่มความน่าสนใจให้กับงานวิจัย (ภาพที่ 1) 



textual analysis หรือการวิเคราะห์ข้อมูลที่เป็นตัวอักษรได้รับความนิยมมากขึ้นเรื่อยๆ ทั้งในทางวิชาการและการใช้งานได้จริงในภาคธุรกิจ เพราะนอกจากข้อมูลตัวอักษรที่มีปริมาณมากแล้ว ข้อมูลตัวอักษรเหล่านี้ยังสามารถบ่งบอกถึงอารมณ์ หรือความรู้สึกของผู้เขียนได้ ซึ่งแตกต่างจากข้อมูลที่เป็นตัวเลข อีกทั้ง เทคโนโลยีที่ช่วยสั่งการให้คอมพิวเตอร์สามารถอ่านและเข้าใจตัวอักษรได้เหมือนดั่งมนุษย์ ที่เรียกว่า “Natural Language Processing” หรือ “NLP” ทำให้เราเขียนโปรแกรมเพื่อสั่งให้คอมพิวเตอร์จำแนกเอกสารออกมาเป็นรายคำ ซึ่งเราสามารถ tag คำและนับคำที่เราสนใจซึ่งเป็นจุดเริ่มต้นในการแปลงข้อมูลจากตัวอักษรมาอยู่ในรูปของตัวเลขในเอกสารจำนวนมากๆ ได้         

ข้อมูลหรือข่าวที่เกี่ยวกับบริษัทเป็นปัจจัยสำคัญที่กำหนดทิศทางของราคาหุ้น โดยบริษัทยิ่งมีข่าวดีราคาหุ้นมักจะปรับในทิศทางขาขึ้น ในขณะที่หากบริษัทมีข่าวร้ายราคาหุ้นจะปรับไปในทิศทางตรงกันข้าม ซึ่งข่าวเหล่านี้ถูกเขียนขึ้นจากคอลัมนิสต์หรือนักวิเคราะห์ผู้ชำนาญในหัวข้อนั้นๆ ซึ่งมีงานวิจัยจำนวนมากที่ใช้คอมพิวเตอร์มานับคำที่มีความหมายเชิงบวก/ลบ และสร้างอัตราส่วนที่เป็นตัวแทนของทัศนคติของผู้เขียน (textual sentiment) จากนั้นนำมาทดสอบกับราคาหุ้นว่าแปรผันตามข่าวดีหรือข่าวร้ายอย่างไร โดยผลการศึกษาส่วนใหญ่พบว่า textual sentiment ในข่าวสามารถอธิบายทิศทางการเปลี่ยนแปลงของราคาหุ้นได้ในระยะสั้น (ไม่เกิน 1 สัปดาห์ ก่อน/หลังประกาศ) ซึ่งในโลกธุรกิจนั้นมีผู้ให้บริการข้อมูลรายใหญ่ที่สนใจพัฒนาฟังก์ชั่นที่เกี่ยวกับ news sentiment แบบ real time และขายข้อมูลนี้เพื่อใช้ประกอบการตัดสินในการลงทุน  


นอกจากข้อมูลข่าวแล้ว ข้อมูล social media มีบทบาทต่อการสื่อสารของคนเพิ่มขึ้นอย่างมาก ซี่งแม้ว่าจะมีลักษณะของข้อมูลที่ไม่เป็นระเบียบ (unstructured) และการใช้ภาษาที่ไม่ค่อยเป็นทางการมากเท่ากับข้อมูลข่าวหรือบทวิเคราะห์แต่มีนักวิจัยอีกจำนวนหนึ่งที่ทำการศึกษาโดยใช้ข้อมูลจาก web board หรือข้อมูลจากแอพพลิเคชั่น Twitter ซึ่งเป็น platform ที่มีผู้ใช้จำนวนมากทั่วโลกมาศึกษาหาผลกระทบต่อราคาหุ้นอีกด้วย

นอกจากนี้ธนาคาร JP Morgan ยังได้พัฒนาดัชนี Volfefe ที่สร้างจากปริมาณการ tweet ของประธานาธิบดี Donald Trump ซึ่งทดสอบแล้วว่าสามารถอธิบายความผันผวนของผลตอบแทนของพันธบัตรรัฐบาลของสหรัฐฯ หรือกรณีการรวมตัวกันบนเวบบอร์ด Reddit ของผู้ลงทุนรายย่อยจำนวนมากเพื่อเข้าซื้อหุ้น GameStop Corp. (GME) ในตลาดหุ้น NASDAQ จนเกิดเหตุการณ์ short squeeze ของนักลงทุนสถาบัน และทำให้เกิดความผันผวนอย่างมากในตลาดหุ้น และต่อเนื่องไปตลาดสินค้าโภคภัณฑ์อื่นๆนั้น อาจเป็นบทเรียนให้ผู้กำกับดูแล (regulator) หรือตลาดหลักทรัพย์ (exchange) สามารถนำเอาเครื่องมือ textual analysis มาใช้เพื่อจับตาพฤติกรรมที่ไม่เหมาะสม ที่เกี่ยวกับการลงทุนผ่านการใช้ social media ของรายย่อยเพิ่มมากขึ้นได้   

ตลาดหลักทรัพย์มีบทบาทเป็นตัวกลางในการซื้อขายหลักทรัพย์และเป็นศูนย์กลางข้อมูลที่รวบรวมจากบริษัทจดทะเบียน ซึ่งผู้บริหารใช้เป็นช่องทางหนึ่งในการสื่อสารกับผู้มีส่วนได้ส่วนเสียของบริษัท โดยเอกสารที่เปิดเผยข้อมูลผลการดำเนินงาน (financial disclosure) นั้นมีอย่างน้อย 4 ประเภทด้วยกัน ได้แก่

         1) รายงานประจำปี

         2) แบบ 56-1

         3) คำอธิบายและการวิเคราะห์ของฝ่ายจัดการ (Management Discussion and Analysis: MD&A)

         4) เอกสารเพื่อยื่นคำขออนุญาตเสนอขายหลักทรัพย์ Initial Public Offering (IPO filing)

ทั้งนี้รายงานประจำปีและแบบ 56-1 นั้นมีเนื้อหาคล้ายกันมาก โดยรายงาน 56-1 จัดทำเพื่อส่งสำนักงาน ก.ล.ต. ให้เข้าใจภาพรวมของกิจการ เช่น ลักษณะธุรกิจ โครงสร้างการถือหุ้น โครงสร้างรายได้ ลักษณะผลิตภัณฑ์ ความเสี่ยง ในขณะที่รายงานประจำปี จัดทำเพื่อรายงานผู้ถือหุ้น เกี่ยวกับรายละเอียดการดำเนินงาน แผนการดำเนินงาน ฐานะการเงิน ซึ่งเอกสารทั้งสองนี้รายงานเป็นรายปี 


ในส่วนของเอกสาร MD&A มีวัตถุประสงค์เพื่ออธิบายถึงการเปลี่ยนแปลงที่เกิดขึ้นกับฐานะการเงินและผลการดำเนินงานของบริษัทในช่วงเวลาหนึ่ง โดยปกติแล้วสำนักงาน ก.ล.ต. กำหนดให้บริษัทจดทะเบียนเปิดเผยข้อมูลดังกล่าวในแบบแสดงรายการข้อมูลประจำปี (แบบ 56-1) แต่เพื่อความต่อเนื่องและรวดเร็วยิ่งขึ้นสำนักงาน ก.ล.ต. จึงมีโครงการสนับสนุนให้บริษัทจัดทำ MD&A สำหรับงบการเงินทุกไตรมาส ซึ่งจะทำให้ผู้ลงทุนเข้าใจฐานะการเงินและผลการดำเนินงานของบริษัทได้ดียิ่งขึ้นนอกเหนือจากข้อมูลตัวเลขในงบการเงินเพียงอย่างเดียว

และส่วนสุดท้ายคือ IPO filing ที่บริษัทต้องยื่นให้กับทางสำนักงาน ก.ล.ต. ก่อนจึงจะสามารถเข้าจดทะเบียนในตลาดหลักทรัพย์ได้ ซึ่งทำหน้าที่เหมือนหนังสือชี้ชวนที่อธิบายเกี่ยวกับลักษณะธุรกิจและผลการดำเนินงานย้อนหลังของบริษัทรวมไปถึงรายละเอียดการเสนอขายหลักทรัพย์ ซึ่งข้อมูลเหล่านี้ถูกเขียนจากฝ่ายจัดการซึ่งควรเป็นผู้มีข้อมูลเกี่ยวกับบริษัทมากที่สุด มีการใช้ภาษาอย่างเป็นทางการ แบ่งหัวข้ออย่างชัดเจนอีกทั้งมีระยะเวลาในการออกที่แน่นอน สำหรับผู้ที่สนใจสามารถ download เอกสารได้ที่ www.set.or.th หรือ www.sec.or.th หรือฝ่ายนักลงทุนสัมพันธ์ของแต่ละบริษัทจดทะเบียน

งานวิจัยด้าน Textual analysis ในเอกสารที่เปิดเผยข้อมูลผลการดำเนินงานนั้นมีการศึกษากันมาเป็นระยะเวลาหนึ่งโดยเฉพาะในตลาดหลักทรัพย์ที่พัฒนาแล้ว โดยงานที่มีชื่อเสียงได้แก่งานของ Engelberg (2008),  Henry (2008), Doran et al. (2010), Davis and Tama-Sweet (2011), Demers and Vega (2011), Huang et al. (2011), Loughran and McDonald (2011a, 2011b) และ Jegadeesh and Wu (2012) ซึ่งได้ข้อสรุปตรงกันว่าเอกสารเหล่านี้มีข้อมูลสำคัญที่ผู้ลงทุนสามารถควรนำไปประกอบการตัดสินใจลงทุน โดยหากซื้อหุ้นของบริษัทที่ผู้บริหารเขียนเอกสารที่เปิดเผยข้อมูลผลการดำเนินงานในเชิงบวก หรือชอร์ตเซลล์หุ้นของบริษัทที่ผู้บริหารเขียนเอกสารที่เปิดเผยข้อมูลผลการดำเนินงานในเชิงลบจะทำให้ผู้ลงทุนสามารถทำกำไรชนะผลตอบแทนของตลาดได้

สำหรับงานวิจัยด้าน textual analysis ในเอกสารที่เปิดเผยข้อมูลผลการดำเนินงานของบริษัทจดทะเบียนไทยยังถือเป็นเรื่องค่อนข้างใหม่ สาเหตุหลักมาจากการตัดคำ (tokenization) กับภาษาไทยนั้นยังไม่สมบูรณ์ อีกทั้ง พจนานุกรม (dictionary) ที่จะใช้กำหนดว่าคำไหนมีความหมายเชิงบวกหรือลบในทางการเงิน ยังไม่มีการศึกษาอย่างกว้างขวางเหมือนในต่างประเทศ

ดังนั้น หากต้องการศึกษา textual analysis กับเอกสารของบริษัทจดทะเบียนไทยจึงควรเริ่มจากเอกสารที่ถูกจัดทำขึ้นเป็นภาษาอังกฤษก่อน ซึ่งหากพิจารณาเอกสารที่เปิดเผยข้อมูลผลการดำเนินงาน 4 ประเภทที่ได้กล่าวไปแล้วนั้น เอกสาร MD&A นั้นเป็นทางเลือกที่น่าสนใจเพราะเนื้อหามุ่งเน้นไปที่ปัจจัยที่ส่งผลกระทบกับผลการดำเนินงาน และเผยแพร่รายงานเป็นรายไตรมาส อีกทั้งมีบริษัททั้งขนาดใหญ่และเล็กจำนวนหนึ่งที่รายงานเป็นภาษาอังกฤษอย่างต่อเนื่อง (โดยคิดเป็นกว่า 50% ของ market capitalization) นอกจากนี้สำนักงาน ก.ล.ต. ยังส่งเสริมให้ผู้บริหารนั้นกล่าวถึงความคิดเห็นเกี่ยวกับแนวโน้มผลประกอบการของบริษัทในอนาคต


ในช่วงปี 2011-2018 มีบริษัทจดทะเบียนไทยจำนวน 49 บริษัทที่จัดทำ MD&A เป็นภาษาอังกฤษติดต่อกันทุกไตรมาส ทำให้มี 1,421 ตัวอย่างในการทำการศึกษาโดยเมื่อทำการ tokenize คำแล้วได้ทั้งหมด 6 ล้านคำแต่หลังจากการสกัดเอาคำเฉพาะที่มีความหมายและน่าจะมีผลกระทบกับราคาหุ้นนั้นทำให้เหลือประมาณ 3 ล้านคำ

และผู้วิจัยได้นำเอาเทคนิคทางด้าน machine learning ที่ชื่อว่า Latent Dirichlet Allocation (LDA) ที่เป็นเครื่องมือสำหรับวิเคราะห์ข้อความในเอกสารปริมาณมากๆ ว่ามีเนื้อหาเกี่ยวกับหัวข้ออะไรเป็นหลัก จากการสังเกต MD&A ของกลุ่มตัวอย่างพบว่าผู้บริหารเขียนถึง 4 หัวข้อหลักๆ ได้แก่

        • Firm’s financial performance : กล่าวถึงผลการดำเนินงานของบริษัทเป็นหลักว่ามาจากการเปลี่ยนแปลงของยอดขาย ต้นทุน หรือ ค่าใช้จ่ายด้านต่างๆ ซึ่งกระทบกับผลกำไรหรือเงินสดของบริษัท

        • Firm’s financial status : กล่าวถึงสถานะทางการเงินของบริษัทและบริษัทย่อยว่ามีการเปลี่ยนแปลงของสินทรัพย์ หนี้สิน หรือส่วนของผู้ถือหุ้นและมีผลกระทบต่ออัตราส่วนทางการเงินต่างๆ ของบริษัท

         • External factor : กล่าวถึงปัจจัยระดับมหภาคซึ่งเป็นตัวแปรที่บริษัทไม่สามารถกำหนดได้ เช่น สภาวะเศรษฐกิจทั้งในและต่างประเทศ อัตราดอกเบี้ย อัตราแลกเปลี่ยน และราคาสินค้าโภคภัณฑ์ เป็นต้น

        • Firm’s industry specific : กล่าวถึงปัจจัยเฉพาะในแต่ละอุตสาหกรรมที่บริษัทประกอบธุรกิจอยู่ เช่น กลุ่มธนาคารกล่าวถึงการเติบโตของสินเชื่อ ในขณะที่กลุ่มบริการกล่าวถึงรายได้จากนักท่องเที่ยวที่เข้าพักโรงแรม


นอกจากการใช้ LDA ในการหา topic ในเอกสาร MD&A แล้ว ผู้วิจัยยังได้ใช้ dictionary-based approach ในการคำนวณ textual sentiment ของแต่ละเอกสารว่าผู้บริหารของบริษัทรายไตรมาสนั้นเขียนถึงคำอธิบายแต่ละหัวข้อในเชิงบวกหรือลบมากน้อยเพียงใด ซึ่งสิ่งสำคัญอย่างหนึ่งคือการเลือกกลุ่มคำหรือสร้างพจนานุกรม (dictionary) ที่จะเป็นตัวกำหนดว่าคำใดมีความหมายเชิงบวกหรือลบ โดยหากอ้างอิงกับงานศึกษาที่คล้ายคลึงกันในต่างประเทศนั้น  dictionary ของ Loughran and McDonald ในปี 2011 นั้นได้รับการยอมรับมากที่สุดเพราะถูกสร้างขึ้นสำหรับการวิเคราะห์เอกสารประกอบงบการเงินโดยเฉพาะ และเมื่อคำนวณ textual sentiment จากคำ 100 คำแรกที่ปรากฎบ่อยที่สุดในแต่ละหัวข้อที่ได้จาก LDA ไปทดสอบสมมุติฐานด้วยแบบจำลองทางเศรษฐศาสตร์ เพื่อหาความสัมพันธ์ระหว่าง textual sentiment กับผลการดำเนินงานของบริษัทในอนาคต และผลกระทบต่อราคาหลักทรัพย์

ผลจากการทำ panel regression สรุปได้ว่าคำอธิบายที่เป็นตัวอักษรในเอกสาร MD&A นั้นมีข้อมูลสำคัญแอบแฝงอยู่โดยที่ผู้บริหารมักเขียนคำอธิบายในเชิงบวกในหัวข้อ firm’s financial performance หากพวกเขาคิดว่าทิศทางผลการดำเนินงานของบริษัทกำลังอยู่ในช่วงขาขึ้น นอกจากนี้ราคาหุ้นยังเปลี่ยนแปลงสอดคล้องกับ textual sentiment ในเอกสาร MD&A อีกด้วย โดยหากคำอธิบายนั้นเป็นไปในเชิงบวก (ลบ) ราคาหุ้นจะปรับตัวขึ้น (ลง) ในช่วง 3-4 วันหลังจากที่ผู้ลงทุนได้รับทราบ

ทั้งนี้ การศึกษานี้ยังทำให้ได้เข้าใจเกี่ยวกับพฤติกรรมการตอบสนองจากข้อมูลของผู้ลงทุนในเชิงลึกมากยิ่งขึ้น อาทิเช่น ผู้ลงทุนตอบสนองข้อมูลในเชิงบวกและเชิงลบไม่เท่ากันโดยผู้ลงทุนนั้นให้ความสำคัญกับข้อมูลในเชิงลบมากกว่า สังเกตได้จากหุ้นของบริษัทที่ประกาศเอกสาร MD&A ออกมาในเชิงลบนั้นราคาหุ้นจะปรับลดลงมากกว่าการปรับเพิ่มขึ้นของหุ้นของบริษัทที่ประกาศเอกสาร MD&A ออกมาในเชิงบวก อีกทั้งผู้ลงทุนยังให้คุณค่ากับ textual sentiment ในหัวข้ออื่นๆ นอกจาก firm’s financial performance อีกด้วย อีกทั้งผลการศึกษาแสดงให้เห็นว่าหลายหุ้นของบริษัทที่เผยแพร่เอกสาร MD&A ออกมาในเชิงบวกนั้นมีความผันผวนของราคาลดลง ในขณะที่การประกาศเอกสาร MD&A ออกมาในเชิงลบไม่ได้มีความสัมพันธ์ต่อการผันผวนของราคาแต่อย่างใด

งานวิจัยนี้เป็นเพียงจุดเริ่มต้นในการศึกษาข้อมูลที่เป็นคำอธิบายและตัวอักษรในเอกสารหรือข่าวในธุรกิจตลาดทุนที่ทุกวันนี้มีปริมาณข้อมูลเพิ่มขึ้นอย่างต่อเนื่อง ซึ่งผู้วิจัยได้ประยุกต์ใช้วิธีการที่ค่อนข้างใหม่ในช่วงปี 2017-2018 อย่างไรก็ดีจากความก้าวหน้าด้านเทคโนโลยีอาจทำให้มีเครื่องมือหรือวิธีการที่ทันสมัยมากยิ่งขึ้น ซึ่งทำให้การทำ textual analysis นี้พัฒนาได้อย่างรวดเร็วโดยเฉพาะการวิเคราะห์คำในภาษาไทยซึ่งหากนำเทคนิคหรือวิธีการในงานวิจัยฉบับเต็มซึ่งสามารถอ่านได้ที่ https://www.set.or.th/th/setresearch/research/working_paper.html มาประยุกต์ใช้อาจสร้างงานผลงานที่สามารถต่อยอดองค์ความรู้เกี่ยวกับ textual analysis ของตลาดทุนไทยในอนาคตได้

 

โดย : ศิริยศ จุฑานนท์ ฝ่ายวิจัย ตลาดหลักทรัพย์แห่งประเทศไทย