■ 적은 수의 쿼리로 최첨단 AI 모델들을 속이는 알고리즘 개발
■ 인공신경망의 효율적인 학습이 가능한 작은 규모의 학습데이터 생성
송현오 교수 연구진이 인공신경망의 취약점을 찾는 적대적 공격 알고리즘 및 학습데이터 압축 알고리즘을 개발하였다.
적대적 공격 [1]: 입력 데이터에 작은 변화를 주어 이산 시퀀스 분류 인공지능이 잘못된 판단을 내리도록 하는 적대적 공격 알고리즘(BBA)을 개발하였다. BBA는 베이지안 최적화 기법을 활용하여 적은 수의 쿼리로 넓은 탐색 영역에서 효과적으로 적대적 공격을 진행한다. 텍스트나 단백질과 같은 이산 시퀀스 데이터에서 BBA는 적은 수의 쿼리로 수정률과 공격 성공률 모두 기존 연구를 크게 능가하는 성능을 얻었다. 본 연구 결과는 인공신경망의 취약점을 찾는데 효과적으로 사용될 수 있다.
학습데이터 압축 [2]: 일반적인 인공신경망의 학습은 방대한 데이터와 컴퓨팅 자원을 요구한다. 본 연구진은 효율적인 인공신경망 학습을 위한 학습데이터 압축 알고리즘을 개발하였다. 특히, 압축 공간을 효율적으로 활용하는 최적화 프레임워크를 제안하고 효과적인 최적화 기법을 개발하여, 고차원 현실 데이터에서 기존 연구의 성능을 크게 향상하는데 성공하였다. 압축된 학습데이터는 인공신경망 구조 탐색이나 연속 학습(continual learning) 등에도 효과적으로 활용될 수 있다.
해당 연구 결과들은 올해 7월 머신러닝 최고 학회인 ICML 2022에 발표될 예정이다.
[1] "Query-Efficient and Scalable Black-Box Adversarial Attacks on Discrete Sequential Data via Bayesian Optimization", Deokjae Lee, Seungyong Moon, Junhyeok Lee, Hyun Oh Song
[2] “Dataset Condensation via Efficient Synthetic-Data Parameterization”, Jang-Hyun Kim, Jinuk Kim, Seong Joon Oh, Sangdoo Yun, Hwanjun Song, Joonhyun Jeong, Jung-Woo Ha, Hyun Oh Song