[AI뉴스] Agent, LLaMA 4, 미래 모빌리티 산업, 논문 리뷰
첫 번째 이야기 Agent 워크숍
💬 다양한 분야의 사람들이 참여 = 서비스형 AI, 에이전트 개발에 대한 관심이 커지고 있다는 평
💬 서비스 개발 AI 쪽에 흥미가 생긴다는 평
1. AutoGen 에이전트 대화 실습
에이전트끼리 피드백을 주고받으면서 시나 시나리오를 만들어가는 장면은 꽤나 창의적이었다.
실제 서비스로 발전하면 창작 돋게도 충분히 쓰일 테지만,
과연 좋은 영향일까란 의구심이 들기도 하다. (출처, 저작권 문제가 분명 있을 것 같다)
2. 데이터 분석용 에이전트 제작 (Gemini + langGraph)
- Gemini API와 langGraph를 활용해서:
- 실행 툴 & 데이터 기반으로 자동 인사이트 추출
- 검색 도구를 이용해 기업 정보 자동 정리 & 보고서 작성
💬
사실상 AI 데이터 분석가인 듯하다.
기업에서 자동화 도구를 많이 쓰는 것처럼 분명 활용면에서는 사람만큼 가치가 있을 것 같다.
DeepSeek도 잠깐 언급되었다.
참 다양한 모델들이 더 좋은 성능을 가지고 나오는 것 같다.
두 번째 이야기 LLaMA 4 모델
🐐 LLaMA 4 출시 (2025.04.05)
- LLaMA 4 Scout
- 최대 1000만 토큰 처리 가능
- 멀티모달 학습
- 적은 자원으로도 빠른 추론
- Single GPU에서도 실행 가능 (단, H100 GPU 기준)
- LLaMA 4 Maverick
- 높은 성능
- 주로 비교되는 모델: Gemini, GPT-4o, DeepSeek V3
- LLaMA 4 Behemoth
- "가장 똑똑한 모델"을 목표로 함
- GPT는 최대 12k 토큰까지 지원한다고 알려졌지만, 실제 성능은 8k 이후부터 하락
- 전문가들은 "LLaMA 4의 1000만 토큰은 검증 필요하나, 20만 토큰은 충분히 가능"이라고 봄
- MoE 방식 (Mixture of Experts) 활성화 중
💬
20만 토큰도 상상이 잘 안 가는 숫자인데 1000만 토큰이라고 광고하는 모델이 나오는 시대에 살고 있다니..
나는 지피티를 자주 쓰는데 최신 모델들과 항상 성능 비교 모델로 뽑히는 것 같다.
🔎그 이유가 궁금했다.
1. 시장 선점 + 대중적 인지도
2. LLM 연구와 커뮤니티에서 기본 참조 모델
3. API와 서비스로서의 활용성
4. 모델 공개 방식의 차이: LLaMA, DeepSeek, Gemini는 오픈 정도나 접근성이 다 다름.
GPT는
- API도 안정적
- 모델 성능도 명확히 알려져 있음→ 실제로 써본 사람들이 많으니 기준 삼기 좋음
💬
같은 이유로 지피티가 매번 성능 비교 모델로 선택된다고 한다.
세 번째 이야기 미래 모빌리티 산업 관련
실물 공개된 미래형 모빌리티 (2050년 출시 목표)
- 산악지형 주행 가능
- 수소 연료 사용
💬
영화에서나 볼 법한 비주얼이었다.
처음 봤을 땐 당연히 CG 처리인 줄 알았는데,
이게 실제로 존재하는 미래형 모빌리티라니.
뭔가 생김새도 독특하다.
트리케라톱스를 닮은 외형 + 강인하면서도 미래적인 느낌.
그리고 문뜩 워터 제트팩이 떠올랐다.
아이언맨처럼 날아다니는 그 모습.
어릴 때 꿈꾸던 상상들이
이렇게 하나씩 현실이 되는 걸 보니
신기하기도 하고, 조금은 두렵기도 하다.
상상 속에서만 존재하던 기술들이 실제로 구현되고 있는 요즘.
한편으로는 빠르게 다가오는 미래가 기대되기도 한다.
그렇지만 이 기술들이 단지 "멋있다"는 이유만으로 만들어진 건 아닐 거다.
예를 들어, 험한 산악 지대를 자유롭게 이동할 수 있는 기술은
그만큼 구조가 어려운 환경에서의 생명을 살리기 위한 목적도 크다.
조난 사고, 산불 현장, 긴급 구조 상황 등에서 기술은 그 어떤 것보다 강력한 도움의 손길이 되어준다.
이럴 땐 기술의 발전이 정말 이롭다고 느껴진다.
반면, 그림을 자동으로 그려주는 기술처럼 저작권이나 창작자의 권리를 침해할 수 있는 영역에서는
'굳이 여기까지 발전되어야 하나?' 하는 의문도 든다.
기술이 발전하는 속도가 빨라지는 만큼,
그 기술이 어디에, 어떻게 쓰일지를 고민하는 일도
이제는 꼭 필요한 시대가 된 것 같다.
네 번째 이야기 논문 리뷰: 기초 에이전트의 발전과 과제
- arXiv 논문: https://arxiv.org/pdf/2504.01990
📚 주요 내용
- 인지과학, 신경과학 기반의 모듈형 에이전트 구조
- 뇌 구조에서 에이전트 행동 모듈 개념 도출
- 에이전트의 환경 적응 방식 탐구
- 집단지성, 안전한 AI 구축 논의
- 인간 전두엽 기능 (계획, 실행, 추론, 기억 등)을 L2~L3 수준으로 구현함
- 이 구조를 토대로 하면 휴머노이드 개발에 큰 도움이 될 수도 있음
한 줄 요약👉 “휴머노이드를 개발하려고 사람의 뇌 구조를 참고해서, 비슷하게 만들고 있는 중이다.”🚀
💬
왜 굳이 인간과 비슷하게 만들어야 하지?
왜 휴머노이드를 계속 발전시키는 걸까?
기계는 기계답게 생기면 안 되는 걸까?
🔎왜 인간형 로봇이 필요한가?
👉사람이 사용하는 공간에서 바로 쓸 수 있기 때문이다.
인간을 기준으로 만들어진 세상 예를 들면, 문 손잡이, 계단, 엘리베이터 버튼 등 에서
로봇이 특별한 개조 없이 활동하려면 결국 인간처럼 생기고 움직이는 게 가장 효율적이란다.
👉감정적 교감과 신뢰를 유도하기 위해
특히 돌봄 로봇, 교육 로봇, 서비스 로봇 같은 경우는
사람의 얼굴을 닮고 친근한 행동을 해야
사람들이 경계하지 않고 마음을 열게 된다고 한다.
👉위험하거나 반복적인 작업을 대체하기 위해 인간의 동작을 그대로 복제할 수 있으면,
사람이 위험하게 일하던 현장에도 휴머노이드를 투입할 수 있기 때문이다.
예: 화재, 원자력 시설, 우주 탐사 등
💡 결국 앞에서도 언급했듯, 중요한 건 방향성인 듯하다. 😊