ฟูจิตสึ ประกาศแผนพัฒนาเทคโนโลยีใหม่ครั้งแรกในโลก เพื่อเพิ่มประสิทธิภาพการใช้งานสูงสุดของหน่วยประมวลผลกลาง (CPUs) และหน่วยประมวลผลภาพกราฟิก (GPUs) ด้วยการจัดสรรแบ่งส่วนทรัพยากรแบบเรียลไทม์ จัดลำดับความสำคัญการประมวลผลให้มีประสิทธิภาพสูงแม้ขณะกำลังประมวลผลภาพกราฟิกอยู่ ฟูจิตสึ ออกแบบเทคโนโลยีนี้ เพื่อแก้ไขปัญหาขาดแคลน GPU ทั่วโลก ด้วยการปรับเพิ่มประสิทธิภาพที่ดีที่สุดของทรัพยากรคอมพิวเตอร์เดิมที่มีอยู่ในระบบ จากความต้องการใช้งาน Generative AI, Deep Learning และแอปพลิเคชันอื่นๆ ขยายตัวเพิ่มขึ้นอย่างมาก
ฟูจิตสึ มุ่งเน้นพัฒนาเทคโนโลยีใหม่ด้วยการประมวลผลแบบ Parallel processing สามารถสลับการประมวลผลของหลายโปรแกรมในเวลาเดียวกันได้ ด้วยการเชื่อมต่อคอมพิวเตอร์หลายตัวเข้าด้วยกัน โดยไม่ต้องรอให้โปรแกรมที่กำลังทำงานในระบบคอมพิวเตอร์สมรรถนะสูง HPC เสร็จสิ้น เทคโนโลยีดังกล่าวทำให้สามารถทำการประมวลผลแอปพลิเคชัน ที่ต้องใช้ทั้งทรัพยากรการคำนวณขนาดใหญ่ และได้ประสิทธิภาพแบบเรียลไทม์ได้ เช่นเดียวกับโปรแกรม Digital Twin และ Generative AI
การส่งมอบเทคโนโลยีที่พัฒนาขึ้นมาใหม่ของฟูจิตสึนี้ จะเป็นส่วนหนึ่งของการเป็นตัวกลาง สามารถช่วยจัดการระบบคอมพิวเตอร์ในอนาคต หรือ Future computer workload broker ซึ่งปัจจุบันยังเป็นซอฟต์แวร์ใหม่ที่ ฟูจิตสึ กำลังพัฒนา เพื่อให้ AI สามารถคำนวณ และเลือกทรัพยากรที่เหมาะสมที่สุดได้อย่างอัตโนมัติ ช่วยแก้ปัญหา ตอบรับความต้องการของลูกค้า อาทิ การคำนวณเวลา ความแม่นยำในการคำนวณ และต้นทุน รวมทั้งตรวจสอบความถูกต้องของเทคโนโลยีดังกล่าวร่วมกับลูกค้า ไปสู่แพลตฟอร์มที่สามารถแก้ไขปัญหาสังคม และสร้างสรรค์นวัตกรรม เพื่ออนาคตที่ยั่งยืนได้ ทั้งนี้ ฟูจิตสึ ได้สาธิตเทคโนโลยีดังกล่าวในงาน SC23 ที่ได้จัดขึ้น ณ ศูนย์การประชุมในเดนเวอร์ สหรัฐอเมริกา โดยมีเทคโนโลยี HPC เป็นหัวข้อไฮไลท์
ฟีเจอร์ของเทคโนโลยีใหม่
1. เทคโนโลยีแรกในโลกที่ใช้ CPU และ GPU แม้ขณะที่เครื่องกำลังประมวลผลโปรแกรม
ฟูจิตสึ พัฒนาเทคโนโลยี ที่สามารถแยกระหว่างโปรแกรมที่ใช้ GPU และโปรแกรมที่สามารถประมวลผลด้วย CPU ได้เป็นรายแรกในโลก แม้ว่าจะมีการประมวลผลหลายโปรแกรมพร้อมกัน ด้วยความสามารถในการคาดการณ์อัตราเร่งและการจัดสรร GPU ได้แบบเรียลไทม์ สำหรับการประมวลผลโปรแกรมที่มีความสำคัญมากๆ
ตัวอย่างเช่น หากผู้ใช้งานมีความต้องการใช้ 3 โปรแกรมในการประมวลผลให้ได้อย่างมีประสิทธิภาพ ด้วย CPU เพียงแค่ 1 ตัว กับ GPU 2 ตัว ก็สามารถทำได้ โดยกำหนดให้ GPU ประมวลผล โปรแกรมที่ 1 และ 2 ตามความพร้อมใช้งานของ GPU จากนั้น เมื่อได้รับคำขอ ของโปรแกรมที่ 3 การจัดสรร GPU จะถูกเปลี่ยนจากโปรแกรมที่ 1 เป็น 3 เพื่อ วัดประสิทธิภาพและความเร่งรัดในการประมวลผลบน GPU โดยจากผลลัพธ์ของการวัดพบว่า เวลาการประมวลผลโดยรวมลดลงจากการจัดสรร GPU ให้กับโปรแกรมที่ 3 มากกว่าการจัดสรรให้โปรแกรมที่ 1 ดังนั้น GPU จะถูกมอบหมายให้กับโปรแกรมที่ 3 และ CPU จะถูกมอบหมายให้กับโปรแกรมที่ 1 ในช่วงเวลาเดียวกัน หลังจากที่โปรแกรมที่ 2 เสร็จสิ้นลง GPU ก็จะว่างจากการใช้งาน ดังนั้น GPU จึงจะถูกมอบหมายกลับไปโปรแกรมที่ 1 อีกครั้ง และด้วยวิธีข้างต้น ทรัพยากรการคำนวณได้รับการจัดสรรเพื่อให้การประมวลผลโปรแกรม ประสบผลสำเร็จในระยะเวลาที่เร็วที่สุด
เทคโนโลยีนี้ช่วยทำให้การฝึกโมเดล ในการประมวลผลข้อมูลกราฟ AI (Processing graph AI data) ในการพัฒนาแอปพลิเคชัน เช่น AI ที่ใช้ GPU และระบบรู้จำภาพขั้นสูง (Advanced image recognition) ได้อย่างรวดเร็ว
ภาพประกอบ 1: ภาพของการสลับการจัดสรรของ CPU and GPU (CPU and GPU allocation switching)
2. เป็นเทคโนโลยีแรกในโลก ที่สามารถสลับการประมวลผลหลายโปรแกรมในระบบ HPC แบบเรียลไทม์
ฟูจิตสึ ได้พัฒนาเทคโนโลยีแรกในโลก เพื่อให้โปรแกรมต่างๆ สามารถสลับการทำงานได้หลายโปรแกรม โดยไม่ต้องรอให้โปรแกรมที่กำลังทำงานอยู่สิ้นสุดลง ภายในระบบ HPC ที่เชื่อมต่อคอมพิวเตอร์หลายเครื่อง ทำให้สามารถใช้ระบบ HPC ที่ประมวลผลโปรแกรมได้อย่างมีประสิทธิภาพแบบเรียลไทม์
เนื่องจากวิธีควบคุมแบบเดิมใช้การสื่อสารแบบยูนิแคสต์ (Unitcast communication) ซึ่งสลับการทำงานของโปรแกรมไปทีละเซิร์ฟเวอร์ ทำให้มีความแตกต่างในด้านของเวลาในการสลับ ซึ่งยากต่อการสลับโปรแกรมแบบเรียลไทม์ แต่การใช้การสื่อสารแบบ Broadcast ที่สามารถส่งไปพร้อมกับการสื่อสารในการสลับการทำงานของโปรแกรม ฟูจิตสึ สามารถทำให้การสลับโปรแกรมแบบ Batch ได้แบบเรียลไทม์ ลดช่วงเวลาระหว่างการสลับการประมวลผลโปรแกรมที่ส่งผลต่อประสิทธิภาพของโปรแกรมจาก 2-3 วินาที เหลือเพียง 100 มิลลิวินาที ในสภาพแวดล้อม HPC 256 โหนด (256 node HPC environment) เนื่องจากวิธีการสื่อสารที่เหมาะสมขึ้นอยู่กับความต้องการของแอปพลิเคชันและคุณภาพของเครือข่าย วิธีการสื่อสารที่เหมาะสมสามารถพิจารณาได้จากระดับของการปรับปรุงประสิทธิภาพ เนื่องด้วยการสื่อสารแบบ Broadcast และประสิทธิภาพของการทำงานที่ลดลง เกิดจากการสูญเสียข้อมูลในระหว่างการส่งต่อข้อมูลบนเครือข่าย หรือ Packet loss
เทคโนโลยีนี้ช่วยให้แอปพลิเคชันที่ต้องการประสิทธิภาพแบบเรียลไทม์สำหรับ Digital Twin, Generative AI รวมทั้ง การค้นพบวัสดุและยา เป็นไปได้อย่างรวดเร็วมากขึ้น ด้วยการใช้ทรัพยากรคอมพิวเตอร์ที่เหมือน HPC
ภาพประกอบ 2: ความแตกต่างของวิธีการสื่อสารที่ใช้ในการสลับการรทำงานของโปรแกรม
แผนในอนาคต
ในอนาคต ฟูจิตสึมีแผนที่จะใช้ประโยชน์จากเทคโนโลยีประมวลผล CPU/GPU ให้ได้สูงสุด เพื่อการประมวลผลที่ต้องใช้ GPU สำหรับแพลตฟอร์ม AI ของฟูจิตสึ ที่ใช้ชื่อรหัสว่า “โคซูจิ” ให้ผู้ใช้งานได้ทดสอบเทคโนโลยี AI ขั้นสูงได้อย่างรวดเร็ว นอกจากนี้ ฟูจิตสึ มีแผนที่จะนำเทคโนโลยี HPC ที่เหมาะสมที่สุด ไปปรับใช้ในการจำลองการประมวลผลแห่งอนาคต หรือ ควอนตัม คอมพิวติ้งของฟูจิตสึ ในระดับ 40 คิวบิต เพื่อร่วมประมวลผลคอมพิวติ้งกับโหนดจำนวนมากขึ้น
นอกจากนั้น ฟูจิตสึ ยังจะนำเทคโนโลยีนี้มาใช้กับบริการ Fujitsu Computing as a Service HPC ซึ่งจะทำให้ผู้ใช้งานสามารถพัฒนาและประมวลผลแอปพลิเคชันในการจำลองการใช้งาน (Simulation) เพื่อเทคโนโลยี AI และเพื่อ Combinatorial optimization problem ซึ่งเป็นปัญหาเกี่ยวกับการหา Object ที่ดีที่สุด จากชุดของ Object จำนวนจำกัด รวมไปถึงสถาปัตยกรรม Composable Disaggregated Infrastructure (CDI) ซึ่งเป็นเทคโนโลยีที่ช่วยให้สามารถเปลี่ยนการกำหนดค่าฮาร์ดแวร์ระหว่างเซิร์ฟเวอร์ได้ นับเป็นส่วนหนึ่งของความพยายามในการสร้างสังคมที่ทุกคนสามารถเข้าถึงทรัพยากรคอมพิวเตอร์ได้อย่างมีประสิทธิภาพสูงสุด และราคาที่เหมาะสมได้อย่างง่ายดาย
“จากความต้องการใช้ AI โดยเฉพาะเทคโนโลยีเกิดใหม่อย่าง Generative AI ที่มาแรง ไทยเป็นหนึ่งในประเทศในภูมิภาค ASEAN ที่ทางฟูจิตสึ ได้รวมเทคโนโลยีดังกล่าวอยู่ในโรดแมปของภูมิภาค เพื่อช่วยลูกค้าปรับเปลี่ยนธุรกิจได้อย่างยั่งยืนด้วยนวัตกรรมและเทคโนโลยีของฟูจิตสึ เทคโนโลยีที่มาช่วยเพิ่มประสิทธิภาพสูงสุดของการใช้งานของหน่วยประมวลผลกลาง (CPUs) และหน่วยประมวลผลภาพกราฟิก (GPUs) โดยสามารถจัดสรรแบ่งส่วนทรัพยากรแบบเรียลไทม์นี้ ยังอยู่ในขั้นตอนของการพัฒนาในแล็บวิจัยของฟูจิตสึ” นางสาวกนกกมล เลาหบูรณะกิจ กรรมการผู้จัดการ บริษัท ฟูจิตสึ (ประเทศไทย) จำกัด กล่าว