고려대학교 DMQA 연구실

Projects

Home
Research
Projects

Number of entries: 9 (필터 적용됨)

Machine Learning Algorithms

공정 인자정보 기반 예측 AI모델 개발(LG생산기술원)

본 프로젝트는 제조 공정에서 사용되는 환경 인자 및 설정 인자를 활용하여 공정 결과를 예측하는 예측 AI 모델 개발을 목표로 한다. 세부 목표는 ① 공정 인자 정보 기반 공정 결과 예측 알고리즘 개발, ② 공정 장비 예열 판정 분류 알고리즘 개발 두 가지로 나눌 수 있다.1. 공정 인자 정보 기반 공정 결과 예측 알고리즘 개발본 프로젝트의 첫 번째 목표는 노광 공정 배경에서 계측되는 환경 인자와 설비 담당자가 직접 설정하는 설정 인자에 의해 글래스 규격 좌표를 나타내는 공정 결과 값(Overlay_X, Overlay_Y)을 정확히 예측하는 예측 알고리즘 개발하는 것이다. 인자들이 변화함에 따라 노광 공정 결과 글래스의 규격 좌표가 정확한 규격 좌표와 일치하지 않는 문제가 존재하는데, 예측 알고리즘을 통해 다양한 인자들과 공정 결과 값의 인과 관계 규명을 목표로 한다. 사용된 데이터의 경우 차수별(4~10차)로 수집되고, 차수의 특성 상 차수별 입력 및 출력 데이터에 약간의 차이가 존재한다. 실험의 경우 특정 한 차수의 데이터를 테스트 할 때, 해당 차수를 제외한 나머지 차수 데이터로 학습된 모델을 사용한다. 그리고 방대한 데이터 수집이 어려운 환경을 반영하여 회귀 문제에 적합한 데이터 증강 방식으로 학습 데이터를 충분히 확보하고, 머신러닝 방법론을 적용하여 공정 결과 값을 예측하였다.2. 공정 장비 예열 판정 분류 알고리즘 개발본 프로젝트의 두 번째 목표는 실제 공정 시작 이전 공정 장비의 예열 완료 상태 여부를 정확히 분류하는 분류 알고리즘을 개발하는 것이다. 본 공정에 들어가기 이전, 시험 글래스(Dummy Glass)를 도메인 전문가의 경험을 기반으로 약 10장 정도 투입하여 공정 장비를 예열시킨다. 하지만 10장이라는 시험 글래스의 수는 어디까지나 전문가의 경험에 의존하고, 실제로 10장 이전에 예열이 완료된다면 불필요한 시험 글래스의 사용을 줄일 수 있다. 따라서 본 프로젝트는 예열 완료 판정을 정확하게 분류하는 모델을 개발하고, 실제 레이블링이 되어있지 않은 시험 글래스에 Inference 실험을 통해 실제로 10장의 시험 글래스가 필요한지 여부에 대한 해석을 진행하였다. 제공받은 데이터로 실험을 진행한 결과, 약 7장의 시험 글래스에 대한 작업을 마치면 예열이 완료되고, 3장의 시험 글래스는 불필요한 것으로 나타났다.

#Regression #Classification #Machine Learning #Explainable AI

2023.06.01 ~ 2023.11.29

Machine Learning Algorithms

Field RMA 불량률 예측 및 불량 분류(LG 디스플레이)

본 프로젝트는 불규칙적인 월별 불량률을 조기에 예측하는(회귀) 태스크와 불량 여부를 조기에 분류하는 태스크의 인공지능 모델을 구축하는 것을 목표로 하였다. 이는 불량률 및 불량을 조기에 탐지하여 제품 품질 및 고객 서비스 품질을 효율적으로 관리하기 위함이다. 월별 불량률을 예측하는 태스크에서는 월별로 불량률 예측 머신러닝 모델을 구축하였으며, 불량을 분류하는 태스크에서는 단일 머신러닝 모델을 구축하였다.1. 월별 불량률 예측월별 불량률 예측은 양산 모델의 특성 데이터와 초기 불량률 데이터를 랜덤포레스트로 학습하여 N개월 후 불량률을 예측하는 태스크이다. 모델 학습을 위해 중요 변수 및 파생 변수를 생성하는 등의 전처리를 수행하였다. 성능 향상을 위해 학습에 사용되는 초기 불량률 기간을 조절하였으며, 도메인 지식을 통한 제품군별 군집화를 진행하였다.2. 제품 계측값을 활용한 불량 분류불량 분류는 제품 계측 값 및 장비 라인 데이터를 학습하여 양품과 불량을 분류하는 이진 분류와 불량의 종류(개월)를 확장한 멀티 클래스 분류 태스크이다. 데이터 수집, 파생변수 생성, 결측치 대체 등 전처리를 수행하였다. 클래스 불균형 문제를 해결 하기 위해 도메인 지식을 통한 여러가지 방법의 다운샘플링 샘플링을 적용하였다. 세가지 앙상블 모델을 통해 성능을 비교했으며, 이진 분류의 경우 변수 중요도를 통해 공정의 주요 인자를 확인할 수 있었다.3. 결론 및 성능 - 결론 : 불량 관련 데이터 전처리 프로세스를 최초로 정의한 것에 의의가 있으며, 회귀 및 분류 두 개 태스크를 수행하는 모델을 각각 구축하여 유의미한 성능을 달성하였다. - 성능 1) 월별 불량률 예측 - MAPE 기준 군집화 전보다 6차 군집화를 통해 성능 개선을 보였으며, MAE 기준 군집화 전보다 제품군별 군집화 및 초기 불량률 기간 조절을 통해 4차, 5차, 6차에서 성능 개선을 보였다. 2) 제품 계측값을 활용한 불량 분류 - 클래스 불균형 문제를 해결하여 이진 분류 기준 Recall 0.69를 달성하였다. 다중 분류의 경우 클래스 개수를 군집화(16개 → 6개)하여 모든 지표 성능을 개선하였다.

#Smart_Maufacturing #Regression #Classification

2022.09.01 ~ 2023.10.31

Machine Learning Algorithms

알려지지 않은 이상 패턴 탐지를 위한 오픈셋 분류 AI 기술 개발(삼성전자)

본 과제는 반도체 공정 설비 데이터를 사용하여 알려지지 않은 이상 패턴을 탐지를 위한 오픈셋 분류 AI 기술 개발을 목표로 한다. 본 과제는 반도체 공정 설비 데이터에 최초 오픈셋 분류 AI 기술 개발이라는 의의를 가지며, 데이터 확보 및 문제 상황 정의부터 모델 구축, 고도화까지 큰 프레임워크를 제안한다. 개발된 모델은 적응형 오픈셋 모델로 새로운 이상 패턴을 조기에 탐지 가능하며, 이 중 새롭게 레이블링이 수행된 데이터를 지속적으로 모델 업데이트에 활용한다. 본 모델은 딥러닝을 활용한 메트링 러닝으로 오픈셋 분류에 적절한 요약값을 추출하였으며, 새롭게 마할라노비스 거리를 활용한 오픈셋 알고리즘을 제안해 최종 분류를 수행하였다. 또한, 액티브 러닝의 개념을 도입하여 알려지지 않은 클래스로 탐지된 데이터 중 정보력이 우수한 데이터를 추가 레이블링하여 모델 업데이트에 활용하였다.

#Open-set Classification

2021.04.01 ~ 2022.03.31

Machine Learning Algorithms

항계안전을 위한 해무예측 및 해양정보 분석·개선(국립해양조사원)

본 프로젝트는 인공지능 기술을 적용하여 인천항 부근에서 발생하는 해무(바다 안개)를 조기 예측하는 것을 목표로 한다. 기존에는 해무 예측을 위해 기계 학습(Machine Learning) 알고리즘을 주로 사용하였다. 하지만 이는 과거 데이터를 함께 사용할 수 없어 시간적 요소를 고려하기 어렵다는 단점이 있다. 고려대학교에서는 과거 시점부터 현재 시점을 입력 데이터로 사용하여 3시간 뒤 해무 발생 여부 예측을 위해 Sequenceto Sequence with Attention, Transformer, Reinforcement Learning을 적용하였다. 인천항에서 수집된 데이터는 1분 단위로 구성되어 있어 10분 단위 데이터로 전처리하였으며 비해무 구간에서 소수의 해무 계측, 해무 구간에서 소수의 비해무 계측 부분을 정제하여 사용하였다. 본 프로젝트에서 구축한 해무 조기 예측 모델은 항구 및 선박 운영 시 발생하는 해양 교통사고, 혼잡한 교통량을 해소해줄 수 있을 것으로 기대한다.

#Early Prediction #Classification #Transformer

2021.03.11 ~ 2021.11.30

Smart Manufacturing

와이퍼 소음 유형 분류 및 정량화 분석 기법 개발(현대 자동차&DSeTrade)

제조 산업에서 특정 제품의 작동으로 인해 발생하는 소리를 관리하는 것은 필수적이다. 현재 엔지니어가 직접 소리를 듣고 소음 발생 여부를 판단하고 있다. 하지만 엔지니어에 따라 달라질 수 있고 엔지니어의 심리 상태에 따라 변화할 수 있는 현재 감성 소음 유형 평가 방식은 한계를 가진다. 최근 합성곱 신경망의 발달로 인해 소리 분야에서도 이를 활용하는 연구가 진행되고 있다. 본 프로젝트에서는 범주 불균형 상황에서 합성곱 신경망 기반 소음 유형을 분류하는 방법과 원인 분석 방법을 제안하였다. 또한 감성 레이블이 없는 소음을 이용해 합성곱 신경망을 사전 학습하여 성능 향상에 성공하였다. 실험을 통해 정확한 예측 성능을 보이며 과 일관적인 분류 기준을 가지는 분류 모형을 학습하였음을 증명하였다. 다음으로 수치형, 범주형 설계 인자를 입력 받아 실질적인 소음 크기인 (dB) 값을 예측하는 모형을 개발하였다. 이 두 가지 모형을 종합하여 엔지니어가 학습한 소음 평가 지식을 일반화 할 수 있을 것으로 기대한다.

#Audio Classification #Classification #Predictive_Modeling

2020.03.01 ~ 2020.11.30

Smart Manufacturing

엔진 생산설비 센서 데이터 기반 알람 발생 예측(현대자동차)

본 프로젝트는 자동차 엔진 생산 공정 품질을 결정짓는 생산설비로부터 수집된 센서데이터 기반 알람 조기예측 분석을 수행하였다. 여러 공정 설비 및 다단계 공정으로 이루어진 엔진생산 공정은 각 설비별 공정이 정상적으로 수행되지 않을 때 알람이 발생한다. 주로 설비 알람 발생 후 유지보수가 이루어지는데 본 프로젝트에서는 알람발생 전조증상을 감지하여 알람을 조기에 예측할 수 있도록 센서데이터 기반 딥러닝 예측모델링을 수행하여 선행적 유지보수를 가능하게 하는 데 목표를 두고 분석을 진행하였다. 다음 세 가지 사항을 고려하여 예측모델링을 수행하였다. (1) 알람조기예측: 입력 센서 데이터가 알람 전조 증상을 설명하도록 데이터를 처리(7일 전, 3일전, 1일전 알람 전조증상으로 labeling), (2) 다중알람예측(multi-label classification): 하나의 센서패턴이 각 설비별 다른 종류의 알람을 나타내는 상황을 고려하기 위해 Multiple labeling 작업을 수행, (3) 비주요알람 처리(open-set classification): 다수 알람 종류에 따르는 모든 설비별 센서데이터 수집이 어려운 상황으로 학습되지 않은 알람 패턴을 예측할 수 있도록 open-set classification 수행이 가능한 모델을 구축하였다. 성능 평가는 다중 분류 문제에서 주로 사용되는 Jaccard 점수 및 F1 점수로 수행했고, 실험 결과 평균적으로 80% 이상 점수를 보여 알람 전조증상을 높은 정확도로 탐지 가능한 점을 확인하였다.

#Manufacturing Process System #Multi-sensor Signal Data #Early Prediction #Multi-label Classification #Open-set Classification

2020.04.27 ~ 2020.10.09

Smart Manufacturing

반도체 물류시스템의 비정상 원인분석을 위한 시그널 패턴 분류(삼성전자)

반도체 물류시스템에서는 공정에 부착된 센서 데이터로부터 나오는 관리 지표를 기반으로 물류 흐름에 대한 모니터링이 이루어진다. 본 프로젝트에서는 1. 이상 탐지, 2. 이상 유형 군집화, 3. 분류 모델 구축의 3단계 과정을 거쳐 반도체 물류시스템의 비정상 원인분석을 위한 시그널 패턴 분류를 수행하였다. 이상 탐지 전 데이터의 시계열 패턴을 반영하기 위하여 구간 분할 및 슬라이딩 윈도우 전처리를 수행하였으며, 이상탐지 과정에서는 머신러닝/딥러닝 기반의 다양한 이상탐지 모델을 적용하여 이상탐지를 수행하였다. 탐지된 이상패턴에 대하여 군집화 작업을 통해 이상 원인에 대한 레이블을 부여하였으며, 할당된 레이블을 사용하여 새로운 데이터가 발생하였을 때 자동으로 정상과 이상 유형별 분류를 수행하는 분류 모델을 구축하였다. 특히 본 프로젝트에서 겪었던 레이블링 문제를 해결하기 위해 자동적으로 레이블을 할당하는 방법론을 개발하고 알려지지 않은 이상 유형에 대한 분류를 가능하게 하는 open set 분류 모델을 구축함으로서 활용 가능성을 높였다.

#Anomaly_Detection #Classification #Logistic_System #TimeSeries_Analysis

2019.03.15 ~ 2019.11.29

Smart Manufacturing

딥러닝 기반 신뢰성 이상 조기 진단/원인 분석 프로세스 고도화(삼성전자)

기존에 사용되는 단변량 모니터링은 변수간 교호작용으로 인해 발생하는 In-Fab 이상 감지와 원인 분석에 어려움이 있다. 다수의 Fab 데이터를 이용하여 신뢰성 이상을 조기에 예측하고, 이상의 원인이 되는 Fab 변수, 설비 등을 탐색하는 방법론이 필요하다. 본 과제에서는 기계학습 기반 In-Fab 이상 조기 예측 모델을 개발하고, 공정 이력 정보를 기반으로 혐의 공정 시퀀스를 도출하는 방법론을 개발했다. 특히, 결측률이 매우 높은 데이터에 대한 모델을 구축하기 위해 결측치 대체 방법론을 다양하게 적용하여 분류 정확도 및 민감도를 향상 시켰다.

#Predictive_Modeling #Classification #

2018.05.21 ~ 2019.04.30

NLP & Text Mining

신종 범죄수법에 대응한 경찰 범죄수법 분류체계 개선 연구(치안정책연구소)

과거 수법범죄 시스템을 통해 수집된 범행수법 데이터를 과학적이고 체계적인 방법론을 통해 분석하여 데이터 기반의 새로운 분류체계를 제안하는 과제이다. 기계학습 기법 중 비지도학습인 군집 분석을 적용하여 유사한 특성을 갖는 범행 사건들을 군집화하고, 군집화 결과를 심층 분석하여 군집 별 특성을 파악하고, 이를 기반으로 신종범죄를 탐색하였다. 또한 범행 사실 텍스트를 이용하여 소분류 단위 범죄를 분류할 수 있는 심층신경망 분류 모델을 구축하고, 심층신경망의 오분류율이 높았던 소분류 간의 통합을 시도함으로써 기존 범죄 분류 체계의 배타성을 향상시켰다. 결과적으로 군집분석 결과와 분류 모델 기반의 범죄 통합 결과를 융합하여 범죄수법 분류체계 개선 방안을 제안하였다.

#Text_Mining #Classification

2017.05.19 ~ 2017.10.31