1. 소식
  2. arrow_forward_ios

새 소식

태그
검색
전체
포스트 대표 이미지

송현오 교수 연구진, 최고 성능의 오프라인 강화학습 알고리즘 개발

■ 새로운 오프라인 강화학습 기법을 제시하여 강화학습의 현실 적용 가능성을 크게 향상 ■ 기존 알고리즘 대비 온라인 강화학습과의 성능 차이를 40% 개선 <a href='http://mllab.snu.ac.kr/' target='_self'>송현오 교수 연구진</a>이 추가적인 상호작용없이 주어진 데이터만으로도 에이전트를 효율적으로 학습시킬 수 있는 오프라인 강화학습 알고리즘(EDAC)을 개발하였다. 새 알고리즘은 인공신경망의 일반화 성능을 활용하여 한정된 데이터에서의 확장성을 훨씬 개선하는 효과를 거두었다. 이번 연구로 미숙한 상호작용이 큰 위험을 초래할 수 있는 응용 분야들(의료, 자율주행 등)에서 강화학습 기법의 활용 가능성이 크게 높아질 것으로 기대된다. 오프라인 강화학습은 추가적인 상호작용없이 주어진 데이터만으로 에이전트를 학습시키는 기법이다. 기존에 경험하지 못했던 환경에 대한 정보를 얻을 수 없기 때문에, 보통의 오프라인 강화학습 기법은 주어진 데이터셋에서 벗어나지 않도록 보수적인 전략을 취하게 된다. 하지만, 기존의 알고리즘들은 인공신경망의 일반화 성능을 고려하지 않고 데이터셋에서 벗어나는 모든 행동을 일괄적으로 배제하는 한계가 있었다. 이러한 한계를 해결하기 위해 <a href='http://mllab.snu.ac.kr/' target='_self'>송현오 교수 연구진</a>은 인공신경망의 일반화 성능을 활용, 높은 확신도로 결과를 예측할 수 있는 행동들에 대해서는 그 행동이 데이터셋 내에 있지 않더라도 배제하지 않는 방법을 제시하였다. 또한, 이러한 예측 확신도의 지표로 기존에 강화학습 알고리즘에서 흔히 쓰이는 Q-함수 앙상블 (Q-function ensemble) 을 사용할 수 있음을 보였다. 마지막으로, 연산 효율성을 위해 특화된 앙상블 다각화 (ensemble diversification) 기법을 개발하여 앙상블의 규모를 줄이면서 성능은 보존하는데 성공하였다. 개발된 알고리즘 EDAC는 기존 알고리즘 대비 온라인 강화학습과의 성능 차이를 40%로 줄이는 성과를 거두었다. <img src='https://cse.snu.ac.kr/sites/default/files/node--notice/20211115_01.png'> <img src='https://cse.snu.ac.kr/sites/default/files/node--notice/20211115_02.png'> 이번 연구 결과는 인공지능 최고 학회 중 하나인 <a href='https://neurips.cc/Conferences/2021/Schedule?showEvent=25921' target='_self'>NeurIPS 2021</a>에서 발표될 예정이다....
포스트 대표 이미지
포스트 대표 이미지

이광근 교수, [Probably Approximately Correct] 번역 출간

기계학습의 원천 기초를 다진 업적으로 2010년 튜링상을 수상한 <a href='https://en.wikipedia.org/wiki/Leslie_Valiant'>Leslie Valiant</a>교수가 40년 연구에서 나온 통찰을 일반인을 위해서 정리한 책 <a href=https://amzn.to/3nfZWwE>[Probably Approximately Correct]</a>가 <a href='http://ropas.snu.ac.kr/~kwang'>이광근 교수</a>의 번역을 거쳐 한국어 버전으로 출간되었다. 이 책은 튜링상 수상 석학이 40년 연구로 제시하는 기계 학습에 대한 근본적 관점을 정리한 책이다. 기계 학습과 인공지능에 대한 아래와 같은 의문들에 대한 궁금증을 해결해준다: - 기계 학습이란 과연 무엇인가? - 기계 학습을 과학적으로 어떻게 정의할 수 있을까? - 기계 학습으로 배울 수 있는 한계는 어디까지 일까? - 기계의 학습과 생명체의 학습은 얼마나 비슷할까? - 기계 학습이 학습과학으로 발전해서 인공지능을 넘어 새로운 과학의 파라다임이 될 수 있을까? [이광근 교수의 번역동기에서] - "기계 학습을 보다 근본적으로 이해할 수 있는 시점을 소개하고" - "모두가 동요하는 인공지능. 흥분과 우려로 충혈된 눈빛을 차분히 가라앉혀 줄 과학이 있다. 널리 알리는 것이 어떨까 싶었다." - "컴퓨터과학이 인공지능과 기계학습 관련해서 물밑에서 다지고 있는 기초공사의 한 구석을 구경하는 투어 코스" - "인공 지능 관련 논의가 신비감에 기대어 부유하지 않도록 과학적인 근거로 내실을 심는 채비가 될 수 있는 책" [기계 학습을 다시 묻다]. 레슬리 벨리언트 지음. 이광근 옮김. 인사이트. 2021. <img src='https://cse.snu.ac.kr/sites/default/files/node--notice/pac-pub.jpg'>...
포스트 대표 이미지
포스트 대표 이미지

2020년 국제 대학생 프로그래밍 경진대회 금메달 수상

2020년 국제 대학생 프로그래밍 경진대회 금메달 수상 - 140개 팀 중 2위... 4년 연속 메달 행진 이어가 미국컴퓨터협회(ACM)가 주최하는 세계 최대 프로그래밍 대회인 ‘국제 대학생 프로그래밍 경진대회(ICPC)’에서 서울대학교가 금메달을 수상했다. 2020년 코로나19 확산으로 한 차례 연기하여, 2021년 10월 5일 러시아 모스크바에서 개최된 본선 대회에서 서울대학교 팀이 140개 팀 중 2위의 성적을 거두며 금메달을 수상하였다. 서울대학교 팀(시제연, 조승현, 박상수, 코치 염헌영 교수)은 15개 문제 중 11문제를 해결하여 아쉽게도 1문제 차이로 월드챔피언에는 오르지 못했으나, 역대 한국대표팀 성적 중 가장 좋은 성적을 거두었다. 서울대학교는 2017년 대회 금메달, 2018년 대회 은메달, 2019년 대회 은메달을 수상한 데 이어, 올해 대회에서 금메달을 얻으며 4년 연속으로 메달을 수상하게 됐다. ICPC는 1977년 ACM(미국컴퓨터협회) 컴퓨터 과학 컨퍼런스에서 처음 개최되어, 매년 전 세계 대학생들이 참가하는 가장 권위있는 컴퓨터 프로그래밍 경시대회이다. 이번 대회를 위한 지역대회에는 115개국 3,514개 대학에서 6만 명의 대학생이 참가했으며, 그 중 최상위 성적으로 지역대회를 통과한 140개팀 420명의 대학생이 '월드 파이널'로 불리는 본선에서 경쟁을 벌였다....
포스트 대표 이미지

전병곤 교수 연구진, 파이썬 딥러닝 프로그램을 정확하고 빠르게 수행하는 시스템 개발

<a href='https://spl.snu.ac.kr/' target='전병곤 교수 연구진'>전병곤 교수 연구진</a>이 <a href='https://friendli.ai/' target='FriendliAI'>프렌들리에이아이(FriendliAI)</a>와 공동으로 모든 딥러닝 프로그램을 수정할 필요 없이 더 빠르게 수행할 수 있는 시스템 Terra를 개발하였다. 그 결과 심볼릭 그래프 처리와 명령형 처리가 동시에 수행되어 훨씬 처리 속도가 빠르게 되었다. 이번 연구는 기존에 없던 새로운 딥러닝 프로그램의 수행 모델을 제시한 것으로, 향후 딥러닝 프레임워크 기술에 새로운 방향을 제시한 것이다. 현재 널리 쓰이는 딥러닝 프레임워크인 파이토치(PyTorch)와 텐서플로우(TensorFlow)는 모두 보통의 파이썬 프로그램처럼 딥러닝 프로그램을 작성한다. 작성된 딥러닝 프로그램은 일반적인 파이썬 프로그램과 마찬가지로, 파이썬 인터프리터가 처리하여 인공지능 연산을 수행한다. 하지만 파이썬 인터프리터를 이용한 수행 방식은 전체적인 딥러닝 연산을 한 번에 표현하는 심볼릭 그래프가 없어서 전체 최적화 시도를 해 볼 수 없기에 학습 속도가 느리다는 단점이 있다. 이를 해결하기 위해 Just-In-Time (JIT) 컴파일 기법을 통해서 주어진 파이썬 딥러닝 프로그램을 심볼릭 그래프로 변환하고, 별도의 심볼릭 그래프 수행 엔진으로 프로그램을 수행하는 다양한 방법들이 제안되었다. 하지만 JIT 컴파일을 이용한 방법 역시 사용자가 코드 수정 해야하거나, 프로그램 수행 정확성이 보장되지 않거나, 파이썬 언어를 제한적으로 지원한다는 한계가 있다. 이에 <a href='https://spl.snu.ac.kr/' target='전병곤 교수 연구진'>전병곤 교수 연구진</a>과 <a href='https://friendli.ai/' target='FriendliAI'>프렌들리에이아이(FriendliAI)</a>는 완전히 새로운 파이썬 딥러닝 프로그램 수행방식을 제안하였다. 기존의 방법처럼 주어진 파이썬 프로그램 전체를 심볼릭 그래프로 변환하는 대신, Terra는 프로그램에서 실제 딥러닝 연산만 수집하여 이에만 대응하는 심볼릭 그래프를 생성한다. 그 후 Terra는 생성된 심볼릭 그래프와 주어진 파이썬 프로그램에서 딥러닝 연산이 아닌 부분들을 동시에 수행하여, JIT 컴파일 방식으로는 수행이 불가능했던 파이썬 프로그램들을 지원한다. Terra의 동시 수행 엔진은 사용자가 작성한 파이썬 딥러닝 프로그램의 수정을 필요로 하지 않으면서 프로그램 수행의 정확성을 보장하고, 파이썬 언어의 모든 문법을 그대로 사용할 수 있도록 한 세계 최초의 방법이다. Terra는 텐서플로우 기본 명령형 수행방식 대비 최대 1.73배 빠른 딥러닝 학습 속도를 제공하고, 기존 텐서플로우에서 사용하는 최신 JIT 컴파일 기반의 오토그래프(AutoGraph)가 수행하지 못하는 프로그램들까지도 더 빠르게 수행할 수 있다. <img src='https://cse.snu.ac.kr/sites/default/files/node--notice/20211020_bgchun2.png'> 이번 연구 결과는 <a href='https://nips.cc/' target='NeurIPS 2021'>NeurIPS(Neural Information Processing Systems) 2021</a>에서 발표될 예정이다. “Terra: Imperative-Symbolic Co-Execution of Imperative Deep Learning Programs”, Taebum Kim, Eunji Jeong, Geon-Woo Kim, Yunmo Koo, Sehoon Kim, Gyeong-In Yu, Byung-Gon Chun. <a href='https://spl.snu.ac.kr/' target='전병곤 교수'>전병곤 교수</a>는 꾸준히 세계를 선도하는 최고 AI 플랫폼 기술을 발표해서 기쁘고 영광이라면서, 최근에는 초거대 AI 연구 개발에 집중하고 있다고 말했다. 특히 전 교수가 설립한 프렌들리에이아이(FriendliAI)는 누구나 초거대 AI 모델을 쉽게 개발해서 사용할 수 있도록, 초거대 AI모델 개발 플랫폼을 만들고 있다고 전했다....
포스트 대표 이미지

Google PhD Fellowship Program 수상자로 선정

김재겸 학생(지도교수 김건희)과 이예진 학생(지도교수 이재욱)이 2021 Google PhD Fellowship Program에서 각각 Machine Learning과 Systems and Networking 분야의 수상자로 선정되었습니다. 시각 및 학습 연구실의 김재겸 학생은 강화학습 분야에서 강건성을 높이는 방법론 및 비지도적 학습 등에 대해 연구하고 있으며, 이를 위해 정보 병목, 상호 정보 최대화를 비롯한 정보 이론적 접근 및 분석, 새로운 환경에서의 스킬 발견 방법론 등을 다루고 있습니다. 아키텍처 및 코드 최적화 연구실의 이예진 학생은 추천 시스템, 자연어 처리 등 중요한 어플리케이션에서 쓰이는 머신러닝 알고리즘들의 병목을 분석하고, 이를 SW 최적화 혹은 SW/HW co-design을 통해 가속하여 성능과 에너지 효율을 높이는 연구를 하고 있습니다. 2009년부터 시작한 Google PhD Fellowship Program은 여러 컴퓨터 관련 분야(Algorithms, Optimizations and Markets, Computational Neuroscience, Human Computer Interaction, Machine Learning, Machine Perception, Speech Technology and Computer Vision, Mobile Computing, Natural Language Processing, Privacy and Security, Programming Technology and Software Engineering, Quantum Computing, Structured Data and Database Management, Systems and Networking)에서 우수한 연구를 하고 있는 대학원생을 선정해 장학금, 연구 멘토링 그리고 구글 인턴쉽 기회를 제공하여 미래 기술을 개발하고 영향력을 끼칠 수 있는 연구를 할 수 있도록 지원하는 프로그램입니다. [관련 홈페이지] - 김재겸 박사수료생 프로필: https://jaekyeom.github.io/ - 이예진 박사수료생 프로필: https://yjyjlee.github.io/ - 기사 원문: Research at Google...
포스트 대표 이미지

2021년 8월 우수학위논문상 수상자 안내

서울대학교 컴퓨터공학부에서는 매 학기 졸업생을 대상으로 우수학위논문상을 수여합니다. 석박사 과정 졸업논문의 경우 논문 심사 위원들이, 학부 졸업 논문의 경우 지도교수가 뛰어난 논문을 선별하여 우수학위논문상 후보로 추천하고, 논문상 심사위원회에서 엄격한 심사를 거쳐 수상자를 선정하고 있습니다. 2021년 가을학기에는 박사 논문상 수상자 2명, 석사 논문상 수상자 1명, 학사 논문상 수상자 1명을 최종 선발하였습니다. o 박사 논문상 수상자: 이준영 (지도교수: 허충길) 제목: A Validated Semantics for LLVM IR 이준영 학생은 LLVM 컴파일러의 중간 언어의 의미론에 존재하는 문제점을 발견하고 이것이 프로그램을 잘못 컴파일하게 만드는 버그의 원인이 된다는 것을 밝혔습니다. 이를 해결하기 위해 중간 언어의 새 의미를 엄밀하게 정의하고 이에 기반한 최적화 자동 검증기를 개발하였습니다. 새 의미는 현재 공식 LLVM 컴파일러에 의해 채택되어가는 중입니다. 관련 연구 결과는 PLDI와 CAV를 포함한 다수의 학술 대회에 발표되었습니다. o 박사 논문상 수상자: 김태욱 (지도교수: 이상구) 제목: Learning and Analysis of Neural Sentence Representations Using Syntax 김태욱 학생은 언어학의 세부 분야인 구문론(syntax)을 활용하여 보다 효과적인 신경망 기반 문장 표현 학습 방법 및 분석 기법을 개발하는 연구를 수행하였습니다. 해당 연구의 세부 내용은 그 우수성을 인정받아 자연어처리 및 기계학습 분야의 최우수학술대회인 AAAI, ACL, ICLR 등에서 발표되었습니다. o 석사 논문상 수상자: 신안재 (지도교수: 전병곤) 제목: TreeML: Taming Hyper-parameter Optimization of Deep Learning with Stage Trees 신안재 학생은 딥러닝 모델의 하이퍼파라미터 최적화 시스템을 연구하여, 최대 6배 정도 자원을 적게 사용하여 같은 성능을 내는 시스템을 개발하여, 국제 우수 학회에 논문을 제출하였습니다. o 학사 논문상 수상자: 권우석 (지도교수: 전병곤) 제목: Nimble: Lightweight and Parallel GPU Task Scheduling for Deep Learning 권우석 학생은 딥러닝 프레임워크의 GPU 추론 및 학습 속도를 향상시키기 위한 소프트웨어 기법을 연구하였습니다. 경량화된 실행 환경과 자동화된 병렬 수행 알고리즘으로 딥러닝 프레임워크의 GPU 가동률을 크게 향상시켰고, 이 결과를 인공지능 분야 최우수 학회인 NeurIPS에 발표하였습니다....
포스트 대표 이미지
포스트 대표 이미지