::고려대학교 DMQA 연구실::

Lab. Activity

 

 

 

Lab. Activity>Conference Review  

2017 대한산업공학회_춘계학술대회 - 김영훈

작성자 김영훈 작성일 2017-05-01 오후 5:59:45
내용
발표 후기
 
제목: Feature Selection for High-dimensional Data via Collinear Group-wise Regression
 
이번 대한산업공학회에서는 고차원의 데이터에서 변수간에 상관관계가 큰 그룹이 다수 존재하는 상황에서 어떻게 하면 효과적이고 정확하게 변수를 선택하는 지에 대한 연구 내용을 발표했다. 본 연구에서는 변수 간에 그룹을 정의하고 이를 정수계획법으로 모델링을 해서 해당 문제를 해결했다. Discrete Fusion Group Regression 이라고 이름 지은 이 방법을 효과적으로 해결하기 위해서 Projected Gradient Descent 기법을 활용해서 정수계획법의 해를 효과적으로 계산했다. 그리고 이를 기존의 다양한 변수선택 기법들과 비교해보았을 때 우수한 변수선택과 예측 성능을 보이는 것을 확인했다. 추후 연구에서는 실제 데이터를 가지고서 기존 방법과 제안한 방법론의 예측 성능을 비교해볼 예정이다.
 
이 연구는 3년 정도 전에 LASSO 문제를 정수계획법으로 해결해보자는 연구에서 시작해서 지금까지 계속해서 진행하고 있는 연구이다. 연구를 시작할 즈음 INFORMS에서 관련 내용으로 MIT에 Bertimas 교수가 기조연설을 한 이후 많은 해외 연구자들이 관련된 연구들을 하고 결과물들을 발표하고 있다. 산업공학의 독창적인 관점으로 머신러닝 문제를 바라보고 해결하는 분야이기 때문에 개인적으로 국내에서도 활발한 연구가 이뤄지면 좋겠다는 생각을 하고 있었다. 그러던 중에 김성범 교수님께서 이번 산업공학회에 우리 연구 그룹의 특별세션을 마련해주셨고, 내가 하고 있는 연구 뿐만 아니라 우리 연구 그룹에서 하고 있는 머신러닝과 최적화의 결합과 관련한 연구들을 많은 사람들에게 알릴 수 있어서 정말 뜻깊은 시간이 되었던 것 같다. 이번 계기를 통해 국내에서도 최적화와 머신러닝을 연계하는 연구들이 다수 진행되고 공유될 수 있었으면 좋겠다고 생각했다. 그리고 내가 발표한 연구가 아직 부족하지만 더욱 좋은 연구가 될 수 있게 노력해야겠다는 생각이 들었다.
 
질문 1. 모델링할 때 파라미터는 어떻게 설정했는가?
답변: Cross-validation을 이용해서 최적의 성능을 내는 파라미터를 선택한다.
 
질문 2. Proximal Gradient Descent 방법을 사용했는데, Acceleration 방법론은 사용했는가?
답변: 아직은 Acceleration 방법론을 사용하진 않고, 고정된 Step size를 이용해서 문제를 해결했다. 변수의 차원이 아주 큰 상황에서 해를 구하는 시간이 길어질 때 쓸 수 있을 것 같다.
 
청취 후기
 
반도체 에칭 공정에서 웨이퍼 내의 공간 위치를 고려한 가상 계측 모형
 
현재 진행하고 있는 가상계측 프로젝트 내용과 밀접한 연관이 있는 내용이라 흥미롭게 들었던 것 같다. 발표자 이름 중에 프로젝트를 같이 진행하고 있는 회사분들도 있어서 더욱 관심이 갔다. 이 연구에서는 웨이퍼의 가장자리와 안쪽의 두께를 가상계측하는 문제를 해결했다. Backward elimination 과 비슷한 방법을 통해서 변수를 선택하고 Weighted KNN을 이용해서 예측모델을 구성했다. 그리고 적응형 모델 업데이트 관련해서 관측치가 하나씩 늘어날 때마다 모델을 업데이트하는 방식으로 예측을 했는데, 현재 우리가 진행하고 있는 프로젝트에도 적용해볼만한 방법이라 생각되었다. 모델을 업데이트하는 방법이 여러가지가 있을 수 있겠으나 모델 학습에 걸리는 시간이 길지 않다면 데이터가 들어올 때마다 모델을 다시 학습시키는 것이 가장 쉽고 효과적이지 않나 생각된다. 특히 가상계측 시스템의 경우 새로운 관측치가 들어올 때까지 걸리는 시간이 길기 때문에 이 방법이 효과적일 것 같다. 
 
Representation Learning based Categorical Data Imputation
 
Representation Learning에 기반해서 범주형 변수의 결측치를 매우는 연구 내용이었다. 기본적으로 결측치가 있는 부분을 다른 변수들의 조합으로 예측해서 결측치를 매우는 아이디어이다. 기존의 다른 방법들의 경우에는 해당 관측치의 레이블을 알고 있어야 정확히 결측치를 매울 수 있지만 제안한 방법의 경우 레이블이 없이도 정확히 결측치를 매울 수 있다는 장점이 있었다. 학회에서 다양한 딥러닝 방법들이 소개되었지만 단순한 적용이나 간단한 변형에 머무는 경우가 많았는데, 일단 이 연구의 경우 문제 설정 자체가 흥미로워서 관심이 갔던 것 같다. 현재에는 범주형 변수의 결측치만 보정할 수 있지만 연속형 변수의 결측치 보정에도 사용될 수 있게 발전시킨다면 흥미로운 연구가 되지 않을까 생각되었다.
 
공급사슬 상에서 공급 불확실성이 소매자주도 및 공급자주도 재고 관리방안에 미치는 영향
 
재고관리를 하는 과정에서 소매자가 주도적으로 물량을 발주할 것이냐 아니면 공급자가 주도적으로 물량을 공급할 것이냐 하는 것은 재미있는 게임이론 문제이다. 공급자가 주도적으로 할 경우에는 생산 효율을 극대화할 수 있겠으나 소매자가 원하는 재고와 납기를 맞추기 어렵다. 반대로 소매자가 주도적으로 할 경우에는 재고를 거의 없이 만들 수 있겠으나 공급자의 효율이 많이 떨어진다. 이런 상황에서 어떻게 효과적으로 문제를 해결할 수 있는지를 게임이론적인 관점으로 접근한 연구 발표였다. 일단 결론은 공급자와 소매자가 결합된 형태에서 가장 효과적인 결과가 나타난다는 것이다. 그리고 그러한 상황에서 누구에게 주도권을 주는 것이 좋은 지는 수학적인 시뮬레이션이 필요하지만 아직 진행되지 않았다고 했다. 최종적인 결과를 보지 못한 것이 아쉬웠지만 게임이론을 활용해서 양자 간 의사 결정을 조절할 수 있는 연구 프레임이 인상깊었다. 최근 기계학습 분야에서도 에이전트 간의 협력을 이끌어내서 최적의 산출물을 내는 방법을 찾기 위해 게임이론이 이용되고 있는데, 관련해서 좀 더 공부를 해보고 싶어졌다.



이전글
다음글

(136-713) 서울시 성북구 안암로145 고려대학교 자연계캠퍼스 신공학관 211호 | TEL.02-3290-3769
고려대학교 산업경영공학과 데이터마이닝 및 품질애널리틱스 연구실. All Right Reserved. 개인정보처리방침