ปฏิเสธไม่ได้เลยว่าในขณะนี้ AI Agents กำลังถูกจับตามองว่าเป็นว่าที่ trend หลักในปี 2025 ไม่ว่าคุณจะเป็นชาว Web2 หรือ Web3 ก็คงต้องผ่านตากับคำๆนี้กันมาบ้าง

ว่าแต่ AI Agents มันคืออะไร เหมือนหรือต่างจาก ChatGPT ไหม วันนี้ผมขออนุญาตเป็นตัวแทนมาเล่าให้เพื่อนๆฟังครับ

หมายเหตุ:

  1. ในบทความนี้ให้ AI = LLM = Chatbot ซึ่งจริงๆแล้วทั้งสี่คำนี้มีจุดที่แตกต่างกัน

    1. AI = เทคโนโลยีที่สามารถแก้ไขปัญหาได้เหมือนมนุษย์

    2. LLM = โมเดลภาษาขนาดใหญ่ที่เน้นการแก้ปัญหาด้านข้อความ เช่น การสร้างข้อความ หรือการแปลภาษา โดย LLM เป็นส่วนหนึ่งของ AI

    3. Chatbot = ระบบตอบคำถามอัตโนมัติสำหรับสนทนากับมนุษย์ ซึ่งอาจใช้หรือไม่ใช้ LLM ก็ได้ ขึ้นอยู่กับความซับซ้อนของงาน

  2. AI Chatbot ในปัจจุบัน จะทำงานโดย”การทำนายคำที่มีความน่าจะเป็นสูงที่สุด”เพื่อที่จะตอบคำถามผู้ใช้งาน ทำให้หลายๆท่านยังมองว่าแชทตอบคำถามได้เพียงเพราะสามารถจดจำข้อมูลจำนวนมหาศาลได้ แต่ก็ปฏิเสธไม่ได้ว่าในปัจจุบัน Chatbot ทำงานได้ดีกว่าตอนที่ LLM ยังไม่บูมมากๆ

Introduction

จากที่ผู้เขียนได้ลองค้นหานิยามของคำว่า AI Agents จากแหล่งต่างๆ เช่น

  1. IBM

  2. AWS

  3. WEF

  4. Microsoft

  5. Gartner

  6. Binance

ผู้เขียนชอบนิยามจากบทความ What is an AI agent? เขียนโดยคุณ Harrison Chase ซึ่งเป็น CEO ของ LangChain (library เจ้าดังสำหรับใช้การพัฒนา AI Chatbot) โดยให้คำนิยามของ AI Agent ไว้แบบกระชับและชัดเจนไว้ว่า

An AI agent is a system that uses an LLM to decide the control flow of an application.

ถ้าให้ผมช่วยตีความในรูปแบบของผม

AI Agents คือระบบที่ใช้ LLM Chatbot ช่วยในการตัดสินใจ

ซึ่งต่างจากบอททั่วไปตรงที่ บอทนั้นถูกจำกัดการทำงานให้อยู่ในระบบที่วางไว้ แต่ Agent นั้นจะมีความสามารถในการตัดสินใจเพิ่มจากการทำงานของ LLM

หากเราออกแบบระบบให้ดีๆ AI Agent จะมีความ autonomous สุดๆ สามารถทำงานได้ตั้งแต่การคำนวณทางคณิตศาสตร์ (จากที่เกริ่นไป แชทบอททั่วไปจะตอบคำถามจากสิ่งที่มันจำได้ แต่ Agents คือ LLM ที่มีเครื่องมือ ช่วยเพิ่มประสิทธิภาพในการทำงาน) ไปจนถึงการดึงข้อมูลจาก, ฐานข้อมูล เว็บไซต์ต่างๆ หรือข้อมูลในเครื่องของด้วยตัวเอง เพื่อใช้ในการวิเคราะห์ข้อมูลและช่วยค้นหา insights จากฐานข้อมูล, ช่วยอัปเดตข่าวสารต่างๆในแต่ละวันที่น่าสนใจ รวมถึงใช้ในการตอบคำถามในชีวิตประจำวัน

Engage with Agentic Apps

สำหรับผู้อ่านที่สนใจสัมผัสประสบการณ์การใช้งาน AI Agents ในเบื้องต้น โดยที่ไม่จำเป็นต้องเสียเงินหลักพัน ทั้งผู้ที่มีและไม่มีสกิล programming ผู้เขียนมีสองผลิตภัณฑ์มาแนะนำให้ลองไปทดลองใช้งานกันกัน

1. Langflow

สำหรับผู้ใช้งานที่อยากลองสัมผัสประสบการณ์สร้าง AI Agents แบบที่ไม่ต้อง coding ตัว Langflow จะมาช่วยในเรื่องของการสร้าง workflow เพื่อออกแบบ GenAI application ที่มี LLM/Agents รวมอยู่ได้อย่างง่ายดาย

ผู้อ่านสามารถศึกษาการใช้งาน Langflow ได้ที่คลิป

https://www.langflow.org/

Pros

  • UI ดูไม่ยาก เหมาะกับผู้ที่เริ่มศึกษา Agents Solution และมีทักษะ programming

  • สามารถออกแบบและควบคุม Flow ได้แบบง่ายๆ เพียงคลิ๊กๆ ลากๆ

Cons

  • อาจมีค่าใช้จ่ายจากการใช้งาน API ของ LLM

  • ผู้เขียนจะต้องมีความเข้าใจเรื่อง programming ในเบื้องต้น และรู้เรื่องการพัฒนา LLM มาก่อน

  • ยังไม่สามารถ track ได้ว่า ในแต่ละ Node ทำอะไรไป มีผลลัพธ์อย่างไรบ้าง

2. Hyperspace AI

ดังนั้นเพื่อให้ผู้ใช้งานทุกๆคน สามารถเข้าถึง AI Agents ได้ง่ายขึ้นและฟรี ผู้เขียนจึงมีอีกผลิตภัณฑ์มานำเสนอนั่นคือ Hyperspace AI ซึ่งเป็น generative browser บน decentralized AI network ซึ่งผู้ใช้งานสามารถใช้งาน Agent ผ่านการใช้งาน inference จากทุกมุมโลกได้แบบฟรีๆ

ผู้อ่านสามารถศึกษาเกี่ยวกับผลิตภัณฑ์ Hyperspace AI ได้ที่คลิป

https://compute.hyper.space/

Pros

  • ไม่จำเป็นต้องสร้าง Flow ให้กับ Agent เพราะมีระบบในส่วนที่ช่วย Automate Flow ให้ อีกทั้งยังสามารถ Modify Flow ให้กับ Agent ต่อได้

  • สามารถ Monitor การทำงานได้แบบ real-time รวมถึงการ track การทำงานของแต่ละ Node

  • ผู้ใช้งานสามารถเลือกข้อมูลที่ต้องการ Web Search ได้ว่าต้องการ source จากแหล่งไหน

Cons

  • อาจไม่เหมาะกับผู้ที่ผ่านประสบการณ์ในการใช้งาน LLM ไม่มาก

  • ผู้เขียนมองว่า ผลลัพธ์ที่ได้ยังไม่ดีเท่าที่ควร

Agentic System Characteristic

คุณ Chase ได้กล่าวไว้ ในบทความ What is an AI agent? ว่า ยิ่งระบบมีความเป็น “agentic” มากขึ้นเท่าไหร่

  1. ตัว orchestration framework จะยิ่งมีประโยชน์มากขึ้น โดย framework นี้จะต้องรองรับการทำ logic และ cycle ของ Flow อย่างครบถ้วน

  2. การรันงาน (jobs) จะยากและซับซ้อนขึ้น รวมถึงจะใช้เวลานานมากขึ้น ผู้ใช้งานอาจจำเป็นต้องรันงานใน background และต้องมีระบบจัดการข้อผิดพลาด (errors) ที่เกิดขึ้นระหว่างทาง

  3. คุณจะต้องการมีปฏิสัมพันธ์กับระบบมากขึ้นระหว่างที่มันทำงาน คุณจะต้องการฟังก์ชันในการตรวจสอบการทำงานของ Agent และสามารถปรับเปลี่ยนสถานะ (state) และคำสั่ง (instruction) ของ Agent ในเวลาที่กำหนด

  4. คุณจะต้องการ framework สำหรับการประเมินผล (evaluation) ซึ่งสามารถรันการทดสอบหลายๆ ครั้งเพื่อจัดการกับผลกระทบที่สะสมจากความสุ่ม (randomness) ที่เกิดจากการใช้ multiple LLMs/Agents และคุณยังต้องการความสามารถในการทดสอบทั้งผลลัพธ์สุดท้าย (final output) และขั้นตอนระหว่างกลาง (steps)

  5. คุณจะต้องมี framework สำหรับการทำการตรวจสอบ (monitoring) แบบใหม่ ซึ่งสามารถเจาะลึกเข้าไปดูแต่ละขั้นตอนที่ Agent ทำ และสามารถ query เพื่อดูผลการทำงานที่เสร็จสมบูรณ์แล้วของ Agent

จากตัวอย่างข้างต้น เพื่อนๆ คงเริ่มเห็นภาพของระบบที่มีลักษณะเป็น agentic มากขึ้นแล้วว่าความ “agentic” ที่มีมากหรือน้อยนั้นแตกต่างกันอย่างไร และมีข้อดีข้อเสียอย่างไร

Other Use Cases

จากบทความ State of AI Agents ของ LangChain ได่ผลสำรวจจากผู้เชี่ยวชาญ 1,300 คนมาว่า use cases หลักของ AI Agents ในองค์กรคือ การทำ Research และ Summarization รองลงมาคือ Personal Assistance และ Customer Service โดยมีแอปยอดนิยมที่ integrate AI Agents Solutions และตอบโจทย์ผู้ใช้สามอันดับแรกดังนี้

  1. Cursor AI แพลตฟอร์มเขียนโค้ด (คล้าย VS Code) ที่ใช้ Agents ทำความเข้าใจโปรเจกต์ของผู้ใช้งาน ช่วยตอบคำถามเกี่ยวกับโค้ด และให้คำแนะนำที่เป็นประโยชน์

  2. Perplexity เป็น search engine platform ที่มอบประสบการณ์ใหม่ด้วย LLM/Agents ในการตอบคำถามซับซ้อนด้วยคำตอบที่เป็นขั้นตอนและอ้างอิงแหล่งข้อมูล เพิ่มความน่าเชื่อถือ

  3. Replit แพลตฟอร์มพัฒนาซอฟต์แวร์ที่มี Agents ช่วยสร้างแอปพลิเคชันตั้งแต่เริ่มต้นแบบ from scratch รองรับการทำงานหลายขั้นตอน การปรับปรุงโค้ด และการทำงานร่วมกับมนุษย์ เพื่อการพัฒนาที่รวดเร็ว.

Conclusion

จากที่ผู้เขียนได้ศึกษา AI Agents มาประมาณ 3 เดือน ผู้เขียนได้ข้อสรุปว่า AI Agents ยังคงเป็นสิ่งที่ควรน่าจับตามองเป็นอย่างยิ่งสำหรับปีที่กำลังจะมาถึงจริงๆ

ผู้เขียนมองในมุม Business ว่าหาก trend นี้มาจริง ผู้พัฒนา closed source AI คงยิ้มแก้มปริอยู่ไม่น้อยถ้าคนสนใจมาพัฒนาและใช้งาน Agents กันงานมากขึ้น เพื่อเป็นการชดเชยค่าใช้งาน API ที่มีแนวโน้มจะลดลงเรื่อยๆ ท่ามกลางการแข่งขันที่คงจะมากขึ้นไปเรื่อย หรือหากตีความให้ง่ายขึ้น trend นี้มีแนวโน้มที่จะทำให้ผู้ใช้งานเรียกใช้งาน API กันมากขึ้นสำหรับ AI Agents สำหรับฝั่ง Web 3 หาก AI Agents สามารถทำกิจกรรม on-chain ต่างๆได้เหมือนมนุษย์จริงๆ ก็อาจไม่จำเป็นที่ต้องมีมนุษย์สำหรับการทำ test ระบบ เพื่อเป็นการลด cost จาก marketing incentives หรือตีความแบบจุกๆคือ end game ของ Airdrop era

หากมองถึง Challenges ของตัว Agents ในปัจจุบัน ผู้เขียนยังมองว่าผู้ที่จะใช้งาน AI Agents จะต้องมีทักษะการใช้งาน LLM เช่น ChatGPT มาพอสมควร แต่ผู้เขียนยังมองว่าเป็นเรื่องที่ดีสำหรับผู้อ่านทุกๆท่านที่อ่านมาถึงตรงนี้ ที่ได้มาเรียนรู้ว่าที่เทคโนโลยีสุดฮอตในปี 2025 ด้วยกัน

Extra: My Discussion about AI Agents

  1. ทำไม AI Agents ถึงเป็นที่ต้องการทั้ง Web2 และ Web 3

  2. เตรียมตัวเรียนรู้ AI Agents สำหรับปีถัดไป

  3. Agents ที่ดี เริ่มจากการมี UI ที่ดี

  4. 99% ของ AI Agents ในปัจจุบันคือ Meme

Mirror文章信息

Mirror原文:查看原文

作者地址:0x33fcaddB3Ca4f9a556324170d911e36881f871ba

内容类型:application/json

应用名称:MirrorXYZ

内容摘要:EPa6euMixKfJpVzXHk7xIEkbOHdzFK7yaMs8zNh13jI

原始内容摘要:k51xtlQlQ6hlgQ3VRn0ICsrsDxcsibnfqDDgtTw16n0

区块高度:1559192

发布时间:2024-12-01 13:57:12