Share on
×

Share

ทำความรู้จัก ‘Pathumma LLM’ โมเดลเพื่อการสร้าง Gen AI เชี่ยวชาญภาษา ข้อมูล และบริบทไทย

ทำความรู้จัก ‘Pathumma LLM’ โมเดลเพื่อการสร้าง Gen AI เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย

ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) พัฒนา Pathumma LLM (ปทุมมา แอลแอลเอ็ม) หรือโมเดล AI ขนาดใหญ่ที่ผ่านการฝึกฝนจากข้อมูลจำนวนมหาศาล ให้มีความสามารถเฉพาะทางโดยเฉพาะทักษะด้านภาษาและการสื่อสารแบบมนุษย์ ทำให้โมเดลนี้มีศักยภาพที่จะเรียนรู้คำถามหรือคำสั่ง (prompt) และสร้างคำตอบที่เหมาะสมด้วยตัวเอง

Pathumma LLM ถูกพัฒนาขึ้น เพื่อสนับสนุนการขับเคลื่อนระบบบริการ AI โดยทีมวิจัยตั้งเป้าหมายในการพัฒนาจุดแข็งของโมเดลให้เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทประเทศไทย รวมถึงเป็น Multi-Modal Generative AI หรือโมเดล AI ที่รองรับการประมวลผลข้อมูลได้หลากหลายทั้งข้อความ รูป และเสียง

ทำไมประเทศไทยต้องมี LLM เป็นของตัวเอง ?

ดร.ศราวุธ คงยัง

ดร.ศราวุธ คงยัง นักวิจัยกลุ่มวิจัยปัญญาประดิษฐ์ เนคเทค สวทช. อธิบายถึงความสำคัญของการพัฒนา LLM ว่า โมเดล LLM แบ่งออกเป็น 2 ประเภท ประเภทแรก คือ โมเดลแบบปิด (close model) หรือโมเดลที่ผู้พัฒนาไม่เปิดให้สาธารณะดาวน์โหลดไปพัฒนาต่อ เช่น Chat-GPT, Gemini, Claude ประเภทที่สองคือโมเดลแบบเปิด (open model) หรือโมเดลที่ผู้พัฒนาเปิดให้สาธารณะดาวน์โหลดไปพัฒนาต่อได้ เช่น Gemma, Sea Lion, Typhoon, THaLLE

“ซึ่งจากข้อจำกัดของโมเดลแบบปิดที่ต้องพึ่งพาการนำเข้าฐานข้อมูลและการปรับแต่งความสามารถจากผู้พัฒนา ทำให้การนำโมเดลประเภทนี้มาใช้งานอาจขาดความคล่องตัว เช่น ไม่สามารถใช้งานในองค์กรที่ต้องปกปิดข้อมูล (ธนาคาร, สถานพยาบาล, ศาล ฯลฯ) ไม่สามารถใช้กับงานเฉพาะทางของประเทศไทย (การเรียบเรียงเอกสารราชการไทย, การสื่อสารภาษาถิ่นไทย, ฯลฯ) ซึ่งจะส่งผลโดยตรงต่อการพัฒนาระบบบริการ AI เพื่อสนับสนุนการทำงานและการให้บริการของทั้งภาครัฐและเอกชน

“จากความสำคัญดังกล่าวทีมวิจัยได้นำความเชี่ยวชาญด้านการพัฒนาโมเดล AI และความพร้อมด้านโครงสร้างพื้นฐานในระดับสากลของ สวทช. เช่น ซูเปอร์คอมพิวเตอร์ลันตา (LANTA) มาใช้ในการผลิต Pathumma LLM สำหรับให้บริการแก่ทั้งภาครัฐและภาคเอกชนไทยในรูปแบบโมเดลแบบเปิด โดยปัจจุบันได้เปิดให้ทดลองใช้งานเวอร์ชัน 1.0.0 แล้วที่ https://aiforthai.in.th/pathumma-llm/ ทั้งในรูปแบบ APP สำหรับให้บุคคลทั่วไปเข้าใช้งานผ่านเว็บแอปพลิเคชัน, API สำหรับนักพัฒนาที่ต้องการดึงข้อมูลแอปพลิเคชันไปแสดงผลที่หน้าเว็บไซต์ของตัวเอง และ Model สำหรับนักพัฒนาที่ต้องการดาวน์โหลดโมเดลไปพัฒนาต่อ ทั้งนี้ Pathumma LLM ยังอยู่ในขั้นตอนการวิจัยและพัฒนา”

พร้อมให้ทดลองใช้ Generative AI สัญชาติไทยแล้ว

ดร.ศราวุธ อธิบายว่าในเวอร์ชันปัจจุบัน Pathumma LLM มีฟังก์ชันเป็น Multi-Modal Generative AI  ที่รองรับการประมวลผลข้อมูล 3 รูปแบบ รูปแบบแรกคือ Text LLM หรือโมเดลสำหรับประมวลผลคำถามหรือคำสั่งที่เป็นข้อความ โดยโมเดลนี้ผ่านการปรับแต่งให้เหมาะกับการสืบค้นข้อมูลและตอบคำถามอย่างเป็นเหตุเป็นผล ทำให้เหมาะแก่การพัฒนาต่อยอดเพื่อใช้ประมวลผลข้อมูลเฉพาะของแต่ละองค์กร เช่น กรมสรรพากรใช้ให้บริการแชตบอตตอบข้อซักถามด้านการยื่นภาษีแก่ประชาชน หน่วยงานวิจัยใช้ให้บริการแชตบอตสืบค้นและสรุปภาพรวมข้อมูลงานวิจัยขององค์กร

“ส่วนที่สอง Audio LLM หรือโมเดลสำหรับประมวลผลข้อมูลที่เป็นเสียง โมเดลนี้ผ่านการปรับแต่งให้ช่วยถอดความจากเสียงได้ทั้งภาษาไทยและอังกฤษ​ สร้างคำบรรยายเสียงบรรยากาศแวดล้อม ระบุอารมณ์และเพศของผู้พูด และตอบคำถามหรือให้ข้อมูลเกี่ยวกับเนื้อหาภายในคลิปได้ ส่วนสุดท้ายคือ Vision LLM หรือโมเดลสำหรับประมวลผลข้อมูลที่เป็นภาพ โมเดลนี้ผ่านการปรับแต่งให้สร้างคำบรรยายภาพ ถอดข้อความที่อยู่ในภาพ และตอบคำถามหรือให้ข้อมูลเกี่ยวกับภาพนั้น ๆ ได้”

การจะเพิ่มประสิทธิภาพและศักยภาพการทำงานให้แก่ LLM ต้องอาศัยปัจจัยหลายด้านโดยเฉพาะปริมาณ คุณภาพ และความทันสมัยของข้อมูล รวมถึงความพร้อมด้านระบบโครงสร้างพื้นฐาน เช่น ระบบ คลาวด์คอมพิวติง (cloud computing) สำหรับใช้ประมวลผล AI

ดร.ศราวุธ อธิบายเสริมเกี่ยวกับแผนการเพิ่มศักยภาพให้แก่ LLM ของประเทศไทยว่า ทีมวิจัยมีแผนจะเริ่มดำเนินงานความร่วมมือกับพันธมิตรทั้งภาครัฐและเอกชนไทยในการพัฒนา foundation model หรือโมเดลพื้นฐานสำหรับประเทศไทยที่มีขนาดใหญ่ขึ้น เพื่อเพิ่มศักยภาพในการรองรับปริมาณข้อมูลและพารามิเตอร์ที่ใช้ในการเทรนโมเดล AI โดยเมื่อพัฒนาแล้วเสร็จสามารถนำโมเดลพื้นฐานที่พัฒนานี้มาใช้เพิ่มศักยภาพการทำงานให้แก่ Pathumma LLM ได้ด้วย ซึ่งคาดว่าจะเริ่มดำเนินงานภายในกุมภาพันธ์ 2568 นอกจากนี้ทีมวิจัยยังมีแผนจะขอความอนุเคราะห์ข้อมูลที่เปิดเผยได้ของหน่วยงานภาครัฐและเอกชนไทยมาใช้เทรน AI เพื่อให้ Pathumma LLM มีฐานข้อมูลมากพอแก่การเป็นโมเดลแบบเปิดที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย และมีส่วนช่วยขับเคลื่อน AI Governance หรือการใช้ AI เพิ่มประสิทธิภาพการทำงานและระบบบริการของภาครัฐในอนาคต

“สำหรับเป้าหมายต่อไปของการพัฒนาระบบ Pathumma LLM ที่ทีมวิจัยตั้งไว้ นอกจากการเพิ่มจุดแข็งด้านข้อมูลและความสามารถในการเป็น Generative AI แล้ว ทีมวิจัยยังมีแผนจะพัฒนาให้ Pathumma LLM ก้าวสู่การเป็น Agentic AI หรือ AI ที่มีศักยภาพในการคิดวิเคราะห์และตัดสินใจด้วยตัวเองอย่างมีประสิทธิภาพโดยอัตโนมัติ เช่น AI ผู้ช่วยส่วนตัวที่ช่วยวิเคราะห์ข้อมูลตลาดและซื้อขายหุ้นตามเงื่อนไขให้โดยอัตโนมัติ หรือแชตบอตช่วยแนะนำระบบบริการที่สอดคล้องกับความสนใจของผู้ใช้งานพร้อมช่วยตรวจสอบสถานะของงานให้โดยอัตโนมัติ ซึ่งการยกระดับสู่ Agentic AI เป็นเทรนด์เทคโนโลยีที่ผู้พัฒนาทั่วโลกต่างกำลังให้ความสำคัญ ณ ขณะนี้ด้วยเช่นกัน”

ผู้ที่สนใจทดลองใช้งาน Pathumma LLM เวอร์ชัน 1.0.0 ทั้งในรูปแบบ APP, API และ Model เข้าใช้งานได้ที่ https://aiforthai.in.th/pathumma-llm/

ข่าวอื่น ๆ ที่น่าสนใจ

Kaspersky เผย SparkCat โทรจันขุดคริปโทฯ ระบาดในแอปฯ

SCB EIC ชวนจับตาสมรภูมิ AI แรงหนุนสำคัญในการปฏิวัติทางเทคโนโลยี

×

Share

ผู้เขียน