1. 소식
  2. arrow_forward_ios

새 소식

태그
검색
전체

전병곤 교수 연구진, 머신러닝 파이프라인을 인공신경망으로 변환하는 기술 개발

전병곤 교수 연구진이 마이크로소프트와 공동으로 전통적 머신러닝 파이프라인을 신경망(neural network)으로 변환해 최적화하는 프레임워크인 WindTunnel을 개발하였다. 이번 성과는 전통적 머신러닝 기법과 최신 딥러닝 기법의 장점을 모두 취하는 핵심 기술로, 클릭률 예측, 추천 시스템 등 다양한 실제 인공지능 응용에 활용될 것으로 예상된다. 딥러닝 기법이 컴퓨터 비전이나 자연어 처리 등 분야에서 효과적인 것으로 나타나 많은 각광을 받고 있지만, 클릭률 예측이나 추천 시스템 등의 인공지능 응용에서 사용되는 표 형식 데이터(tabular data)에 대해선 여전히 선형 모델(linear model)이나 GBDT(gradient boosting decision trees)와 같은 전통적 머신러닝 기법이 더 나은 성능을 보이는 경우가 많다. 전통적 머신러닝 기법을 사용할 때는 보통 다수의 머신러닝 모델 및 데이터 변환 연산을 엮어서 하나의 머신러닝 파이프라인을 구성하고, 학습 시에는 파이프라인을 구성하는 각 요소를 개별적으로 학습한 후 사용하게 된다. 전병곤 교수 연구진은 파이프라인의 각 구성 요소를 개별적으로 학습한 후 이를 인공신경망으로 변환하여, 변환된 여러 구성 요소를 역전파(backpropagation)을 이용해 한번에 최적화하는 기술을 개발하였다. 특히 GBDT나 범주형 데이터 인코더(categorical feature encoder)와 같이 일반적으로 미분 불가능한 구성 요소를 신경망으로 변환하고 최적화하는 방법을 제안하였다. 이 기술을 이용해 개발된 WindTunnel 프레임워크는 기존 방법 대비 더 높은 예측 성능을 달성할 뿐 아니라, 표 형식 데이터에 대해 전통적인 머신러닝과 딥러닝 기법 사이의 절충안을 찾는 다양한 향후 연구로 이어질 수 있을 것이란 평가를 받았다. https://cse.snu.ac.kr/sites/default/files/node--notice/20210803_bgchun2.png 이번 연구 결과는 VLDB(International Conference on Very Large Data Bases) 2022에서 발표될 예정이다. "WindTunnel: Towards Differentiable ML Pipelines Beyond a Single Model", Gyeong-In Yu, Saeed Amizadeh, Sehoon Kim, Artidoro Pagnoni, Ce Zhang, Byung-Gon Chun, Markus Weimer, and Matteo Interlandi....
포스트 대표 이미지
포스트 대표 이미지

허충길 교수 연구진, PLDI 2021 최우수 논문상 수상

허충길 교수와 이준영 박사과정생이 마이크로소프트연구소 및 유타대학교와 공동으로 개발한 LLVM 컴파일러 최적화 자동 검증 프레임워크 Alive2가 프로그래밍 언어 분야 최우수 학술대회인 PLDI 2021 (The 42th ACM SIGPLAN International Conference on Programming Language Design and Implementation)에서 최우수 논문상 (Distinguished Paper Award)을 수상하였다. 올해 6월 온라인으로 개최되는 PLDI 2021에는 총 87편의 논문이 채택되었으며, 최우수 논문상은 그 중 8편의 논문에 수여되었다. Alive2 프레임워크는 컴파일러 실행 중 생성된 최적화 전후 프로그램들의 실행의미 및 이들의 동등함을 수식으로 표현한 후, 마이크로소프트의 자동수식검증기(SMT solver)인 Z3를 사용해 최적화의 올바름을 보이거나, 그렇지 않으면 오류를 찾아낸다. 이때 핵심기술은 프로그램의 복잡한 실행의미를 SMT solver가 쉽게 풀 수 있는 형태로 효율적으로 표현하는 것이다. SMT solver는 수학적으로 엄밀하게 수식의 참/거짓을 체크하기 때문에, Alive2는 오탐(False Alarm)이 거의 없고 테스팅으로는 찾을 수 없는 오류들을 찾아낼 수 있다. Alive2는 지금까지 테스팅으로서는 발견할 수 없었던 수십개의 컴파일러 버그를 발견하였으며, 기존에 발견되지 않았던 LLVM 중간 언어 명세의 문제 또한 새로 발견하였다. 논문 리뷰 과정에서는 해당 기여의 중요성을 인정받아 네 명의 심사위원 전원으로부터 최고 점수인 Strong Accept 평가를 받았다. Alive2의 온라인 서비스(https://alive2.llvm.org) 는 현재 LLVM 커뮤니티의 코드 리뷰 단계에서 개발자들에 의해 활발하게 사용되고 있다. "Alive2: Bounded Translation Validation for LLVM.", Nuno P. Lopes, Juneyoung Lee, Chung-Kil Hur, Zhengyang Liu, John Regehr....
포스트 대표 이미지

강유 교수 연구진, 실세계 데이터를 분석 및 예측하는 AI 기술들로 세계 선도

강유 교수 연구진이 실세계 데이터 분석 및 예측을 정확하고 효과적으로 수행하는 기법들을 개발하였다. 해당 기법들은 시간적 특성을 갖는 데이터에 맞게 설계되었으며, 각 데이터의 성격 및 특성에 따라 최적화되었다. 연구진의 이번 성과는 시계열 데이터, 텐서 데이터, 주가 데이터, 지식 그래프 등 다양한 데이터에 대한 분석 및 예측에 범용적으로 쓰이는 핵심 기술로, 앞으로 다양한 AI 응용에 활용될 것으로 예상된다. 데이터 분석에 널리 쓰이는 푸리에 변환(Fourier Transform)의 일부 계수를 신속.정확히 구하는 기술인 PFT(Partial Fourier Transform) 개발 “Fast and Accurate Partial Fourier Transform for Time Series Data.”, Yong-chan Park, Jun-Gi Jang, and U Kang. 고차원 텐서 데이터의 특정 시간대 패턴을 터커 분해(Tucker decomposition)를 통해 효율적으로 구하는 기술인 Zoom-Tucker(Zoomable Tucker decomposition) 개발 “Fast and Memory-Efficient Tucker decomposition for Answering Diverse Time Range Queries”, Jun-Gi Jang and U Kang. 주식 종목간 상관관계를 학습함으로써 주가 움직임을 정확히 예측하는 모델인 DTML(Data-Axis Transformer with Multi-Level Contexts) 개발 “Accurate Multivariate Stock Movement Prediction via Data-Axis Transformer with Multi-Level Contexts.”, Jaemin Yoo, Yejun Soun, Yong-chan Park, and U Kang. 지식 그래프에서 시간 정보를 고려한 그래프 뉴럴 네트워크를 학습함으로써 지식 그래프 추론을 정확하게 수행하는 모델인 T-GAP(Temporal GNN with Attention Propagation) 개발 “Learning to Walk across Time for Interpretable Temporal Knowledge Graph Completion.”, Jaehun Jung, Jinhong Jung, and U Kang. 위 논문 4편은 오는 8월 빅데이터 및 인공지능 분야 최우수 학회인 The 27th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 2021)에 발표될 예정인데, 한 연구실에서 KDD에 4편을 발표하는 것은 매우 이례적인 성과이다....
포스트 대표 이미지

김선 교수, 2021년도 '훌륭한 공대교수상' 학술상 수상

김선 교수가 생물정보학 및 인공지능 분야 인재 육성 및 학술 발전에 기여한 공로를 인정받아 2021년 '훌륭한 공대교수상' 학술상 수상자로 선정되었다. 김선 교수는 2011년 서울대 교수로 부임해 석사 14명, 박사 및 박사 후 연구원 13명을 배출했으며 부임 이후 현재까지 서울대학교 생물정보연구소 소장을 역임하며 학술적, 교육적 측면에서 세계 최고 수준의 결과를 나타내고 있다. 또한 다수의 국책연구과제를 수행하면서 국내외 저명 학술지에 92편의 학술 논문을 발표했고 현재까지의 연구성과 SCI 논문 Impact Factor 합은 337.218이다. 2021년에는 사단법인 세계언론협회 주최 KOREA AWARDS ‘과학공로大賞'에 선정되는 등 다수의 기관에서 수상하였다. 2017년에는 한국정보과학회 인공지능 소사이어티 학회 회장을 역임하면서 국내 최초로 인공지능 관련 학술대회(THE AI KOREA)를 기획∙개최하여 국내를 대표하는 인공지능 분야 학술 행사로 발전시킨 바 있다. GIW 2017, APBC 2020, IEEE BIBM 2020 등 국제 학술대회를 국내 유치하며 국내 생물정보학 분야 연구를 세계 수준으로 향상시키는데 공헌했다. 훌륭한 공대교수상은 공과대학 교수들의 연구 활동을 진작하고 산업 기술의 선진화를 기하기 위하여 1992년 7월 공대 15회 동문들이 출연한 기금으로 공대 학술상과 기술상을 제정하며 시작되었으며 2014년부터는 교육상, 학술상, 산학협력상 세 분야로 나눠 지금까지 총 71명의 교수가 수상했다. 교육상은 창의적이고 진취적으로 교육에 헌신한 교수, 학술상은 학술 업적이 탁월한 교수, 산학협력상은 산학협력 성과가 탁월해 산업 기술 발전에 지대한 공헌을 한 교수에게 수여한다....
포스트 대표 이미지

전병곤 교수 연구진, 빠르고 정확한 인공지능 학습 데이터 증강 시스템 개발

전병곤 교수 연구진, 인공지능 학습 데이터 증강을 빠르게 하는 새로운 데이터 캐싱 시스템으로 세계 선도 머신러닝 모델 학습시 모델의 품질은 유지하면서 데이터 재사용을 가능하게 캐싱 이론인 데이터 리퍼비싱(Data Refurbishing) 제안 제안한 이론을 효율적으로 수행하는 증강 특화 캐싱 시스템인 리뱀퍼(Revamper) 개발 다양한 머신러닝모델 학습에서 기존 방식 대비 최대 2.17배의 학습 속도 향상 전병곤 교수 연구진은 데이터 증강(Data Augmentation)과정을 최적화하여 머신러닝 학습 수행시 기존 시스템 대비 최대 2.17배 빠른 속도로 수행하는 리뱀퍼(Revamper) 시스템을 개발하였다. 해당 시스템을 통해 다양한 분야에서 인공지능 학습을 보다 효율적으로 수행하는 것이 가능할 것으로 기대한다. 데이터 증강은 학습 데이터에 임의의 변환 연산을 적용함으로써 실질적인 학습 데이터의 수를 증가시키기 때문에 인공지능 학습에서 인공지능 모델의 성능을 높이기 위해 사용된다. 하지만 데이터 증강은 많은 양의 중앙 처리 장치(CPU) 자원을 필요로 하는데, 이는 그래픽 처리 장치(GPU)의 성능이 빠르게 향상됨에 따라 인공지능 모델 학습의 속도를 저하시키는 새로운 병목 요인이다. 이 문제를 해결하기 위해 전병곤 교수 연구진은 새로운 데이터 캐싱 시스템인 리뱀퍼를 개발하였다. 기존에 구글에서 제안한 방식은 최종 증강한 표본을 일정 회수 재사용하여 속도를 향상하는데 학습된 모델의 정확도 저하가 있다는 문제점이 있다. 본 연구진은 학습된 모델의 성능 저하 없이 표본을 재사용하는 데이터 리퍼비싱 기법을 제안하였다. 데이터 리퍼비싱은 데이터 증강 과정을 두 부분으로 나누어 부분적인 데이터 증강 연산이 적용된 표본들을 일정 횟수 재사용하고 학습에 사용하기 전에 나머지 증강 연산을 수행하는 방식으로 모델 정확도 저하 문제를 해결하였다. 그리고 이 방식을 효율적으로 지원하기 위해 재사용하는 표본들을 여러 학습 스텝에서 고르게 사용하는 새로운 캐싱 시스템인 리뱀퍼를 구현하였다. 리뱀퍼는 파이토치(PyTorch) 데이터로더 대비 최대 2.17배 빠른 인공지능 학습 속도를 제공한다. 리뱀퍼는 개발 시 사용자의 편의성을 고려하여 설계했으며 기존에 사용하던 파이토치 모델을 리뱀퍼를 이용해 빠르게 수행할 수 있다. 이 연구 결과는 오는 7월 USENIX ATC (Annual Technical Conference)에서 발표될 예정이다. “Refurbish Your Training Data: Reusing Partially Augmented Samples for Faster Deep Neural Network Training", Gyewon Lee, Irene Lee (Georgia Institute of Technology), Hyeonmin Ha, Kyunggeun Lee, Hwarim Hyun, Ahnjae Shin, and Byung-Gon Chun....
포스트 대표 이미지
포스트 대표 이미지

전병곤 교수, EuroSys Test of Time Award 2021 수상

전병곤 교수, 2021년 EuroSys Test of Time Award 수상 유럽 컴퓨터 시스템 학회에서 10년간 가장 영향력 컸던 논문으로 선정 2011년 발표한 모바일-클라우드 컴퓨팅 연구로 수상 쾌거 전병곤 교수의 연구가 한국 최초로 올해 유럽 컴퓨터 시스템 학회 EuroSys의 Test of Time Award를 27일 수상하였다. 유럽 컴퓨터 시스템 분야의 최고 학회인 EuroSys는 10년 전에 발표된 시스템 연구 논문 중 10년간 가장 영향력이 컸던 논문 1편을 선정하여 Test of Time Award를 수여한다. 전 교수는 작년에도 또다른 논문인 테인트드로이드(TaintDroid) 연구가 10년간 가장 영향력 있는 논문으로 선정되어 ACM SIGOPS 명예의 전당에 오른 바 있다. 이번에 수상한 연구는 2011년 EuroSys에서 발표한 클론클라우드(CloneCloud) 연구이다. 당시 연구팀은 세계 최초로 모바일 클론을 클라우드에서 수행하여 모바일에서 수행하는 계산을 클라우드에서 증강하는 시스템 기술을 제안하였다. 구글 스칼라에 의하면 해당 논문은 2300회 이상 인용되었으며 모바일 클라우드 컴퓨팅 분야를 개척한 연구로 산학계에서 인정받고 있다. 이번 수상으로 전병곤 교수는 10년간 가장 영향력 있는 연구로 연이어 인정받은 것이다. 전병곤 교수는 미래선도기술을 감지, 연구, 개발하는 능력을 인정받은 것 같아 기쁘고 영광이라면서, 최근에는 새로운 언어 인공지능을 연구 개발하고 있다고 말했다. 특히 전 교수는 (주)프렌들리에이아이(friendli.ai)를 설립하였으며 GPT-3와 같은 초대형 언어 인공지능을 대규모 분산 학습으로 만들어 사용자들에게 제공하겠다고 전했다. 시상식은 EuroSys 2021 학회에서 온라인으로 한국시간 24일 오후 6시경 진행됐다. [수상 논문] “CloneCloud: Elastic Execution between Mobile Device and Cloud”, Byung-Gon Chun, Sunghwan Ihm, Petros Maniatis, Mayur Naik, Ashwin Patti....
포스트 대표 이미지

박근수 교수 연구진, 빅데이터 그래프 분석 기술로 세계 선도

박근수 교수 연구진, 빅데이터 그래프 분석 기술로 세계 선도 빅데이터 그래프 패턴 탐색 기술 개발 동적 그래프 패턴 탐색 기술 개발 박근수 교수 연구진이 부분그래프 질의 처리(subgraph query processing), 부분그래프 매칭(subgraph matching), 연속적 부분그래프 매칭(continuous subgraph matching) 알고리즘을 활용하여, 세계 최고 성능의 빅데이터 그래프 분석 기술을 개발하였다. 부분그래프 질의 처리(subgraph query processing) 및 부분그래프 매칭(subgraph matching) 알고리즘은 소셜 네트워크 등에서 특정한 패턴을 찾아내는 기술로서, 박근수 교수 연구진이 개발한 알고리즘은 벤치마크 데이터에서 이전 최고 성능 알고리즘보다 최대 800배 빠르게 패턴을 찾아내며, 크기가 큰 패턴도 빠르게 찾을 수 있다. "Versatile Equivalences: Speeding up Subgraph Query Processing and Subgraph Matching", H. Kim, Y. Choi, K. Park, X. Lin, S.H. Hong, and W.S. Han. 이 논문은 오는 6월 SIGMOD 2021에서 발표될 예정이다. 연속적 부분그래프 매칭(continuous subgraph matching) 알고리즘은 데이터 그래프가 변화할 때마다 쿼리 그래프와 동형이면서 새로 생기거나 삭제되는 데이터 그래프의 부분그래프를 찾아내는 분석기술로서 사이버 보안, 사기 탐지, 소셜 네트워크 서비스 등에서 이용된다. 새로이 제안한 알고리즘은 벤치마크 그래프 데이터에서 이전 최고 성능 알고리즘보다 수백 배 빠르게 문제를 해결한다. "Symmetric Continuous Subgraph Matching with Bidirectional Dynamic Programming", S. Min, S.G. Park, K. Park, D. Giammarresi, G.F. Italiano, and W.S. Han. 이 논문은 오는 8월 VLDB 2021에서 발표될 예정이다....
포스트 대표 이미지

김건희 교수 연구진, 동영상 기반 자기지도학습방법 개발

김건희 교수 연구진이 Microsoft Research, Nvidia의 연구진들과 공동으로 동영상 표현 학습에 사용 가능한 효율적인 딥러닝 모델 (multimodal Transformer)을 개발하였다. 모델을 학습하기 위해 새로운 자기 지도 학습 기법이 제안되었다. 이 방법은 수많은 동영상 데이터로부터 영상, 음성, 자연어 정보의 상관 관계를 모델이 스스로 배울 수 있도록 하여 사람의 레이블 없이도 더 높은 인식 성능을 달성할 수 있다. 또한 딥러닝 모델의 크기를 효과적으로 줄여 적은 자원으로도 우수한 성능을 얻을 수 있게 되었다. 본 연구는 마이크로소프트의 공식 기술 연구 블로그에서도 우수 연구로서 자세히 홍보되고 있다. 김건희 교수 연구진은 위의 연구를 포함하여 기계학습과 관련된 다음의 연구들을 진행하였다. 자기지도 동영상 표현 학습에 사용 가능한 효율적인 딥러닝 모델 개발 “Parameter Efficient Multimodal Transformers for Video Representation Learning.”, Sangho Lee, Youngjae Yu, Gunhee Kim, Thomas Breuel(Nvidia), Jan Kautz(Nvidia) and Yale Song(Microsoft Research). 압축된 비디오 데이터에 활용 가능한 자기지도 표현 학습 방법 개발 “Self-Supervised Learning of Compressed Video Representations.”, Youngjae Yu, Sangho Lee, Gunhee Kim and Yale Song(Microsoft Research). 차원수 압축 및 적대적 강건성을 제공하는 이산 압축 표현 학습 방법 개발 “Drop-Bottleneck: Learning Discrete Compressed Representation for Noise-Robust Exploration.”, Jaekyeom Kim, Minjung Kim, Dongyeon Woo and Gunhee Kim. 역전파 알고리즘을 사용하지 않고도 성능 저하없이 계층 블럭을 병렬적으로 학습할 수 있도록 하는 AutoML 방법 개발 “SEDONA: Search for Decoupled Neural Networks Toward Greedy Block-wise Learning.”, Myeongjang Pyeon, Jihwan Moon, Taeyoung Hahn and Gunhee Kim. 위 논문 4편은 오는 5월 ICLR(International Conference on Learning Representations) 2021에 발표할 예정이다....
포스트 대표 이미지