- Видео 306
- Просмотров 42 738
BK21데이터사이언스와비즈니스포텐셜교육연구단
Добавлен 1 апр 2021
서울과학기술대학교 BK21 데이터사이언스와 비즈니스 포텐셜 교육연구단 공식유튜브 계정입니다.
[DS Interface] Community-based Dynamic Graph Learning for Popularity Prediction
- 발표자: 석사과정 2학기 임보영
- 본 영상은 KDD에 2023년 발표된 “Community-based Dynamic Graph Learning for Popularity Prediction” 연구를 요약 정리한 것입니다. 이 논문은 온라인 쇼핑몰과 같은 플랫폼에서 사용되는 유저-아이템 그래프를 사용해서 시간의 흐름에 따라 데이터의 변화를 잘 탐지하고 이에 따라 효과적으로 표현을 학습할 수 있는 프레임워크인 CDGP를 제안하였습니다. 실제 산업에서 데이터가 실시간으로 생성되기 때문에 이러한 특성에 맞추어 실용적인 프레임워크를 제안을 하였고, 커뮤니티 기반의 방식으로 시간의 흐름에 따라 동적으로 표현 학습을 위한 모듈들을 설계하였다는 점에서 이 논문의 공헌이 돋보입니다. 특히 노드 단과 커뮤니티 단으로 나누어 표현 학습을 하기 때문에 보다 정교하게 학습이 가능하였습니다. 다양한 실험을 통해 제안하는 프레임워크의 효용성을 입증하였습니다.
- Link:dl.acm.org/doi/abs/10.1145/3580305.3599281
- 본 영상은 KDD에 2023년 발표된 “Community-based Dynamic Graph Learning for Popularity Prediction” 연구를 요약 정리한 것입니다. 이 논문은 온라인 쇼핑몰과 같은 플랫폼에서 사용되는 유저-아이템 그래프를 사용해서 시간의 흐름에 따라 데이터의 변화를 잘 탐지하고 이에 따라 효과적으로 표현을 학습할 수 있는 프레임워크인 CDGP를 제안하였습니다. 실제 산업에서 데이터가 실시간으로 생성되기 때문에 이러한 특성에 맞추어 실용적인 프레임워크를 제안을 하였고, 커뮤니티 기반의 방식으로 시간의 흐름에 따라 동적으로 표현 학습을 위한 모듈들을 설계하였다는 점에서 이 논문의 공헌이 돋보입니다. 특히 노드 단과 커뮤니티 단으로 나누어 표현 학습을 하기 때문에 보다 정교하게 학습이 가능하였습니다. 다양한 실험을 통해 제안하는 프레임워크의 효용성을 입증하였습니다.
- Link:dl.acm.org/doi/abs/10.1145/3580305.3599281
Просмотров: 48
Видео
[DS Interface] Large Pre-trained Language Models Contain Human-like Biases ofWhat is Right and Wrong
Просмотров 26Месяц назад
- 발표자: 석사과정 3학기 김지민 - 본 영상은 2022년 발표된 “Large Pre-trained Language Models Contain Human-like Biases of What is Right and Wrong to Do” 연구를 요약 정리한 것입니다. 이 논문은 Aritifivial Writing이 발전하면서 language model이 도덕적 규범에서 임베딩 공간에 PCA로 계산할 수 있는 방향을 기하학적으로 보여줄 수 있는 것을 보여주며, 훈련텍스트에 대해 함시적으로 표현된 사회 규범에 대한 구문을 잘 반영하고 language model의 독성 퇴화를 완화하고 예방하는 방법을 제공하는 논문입니다. - Link: arxiv.org/abs/2103.11790
[DS Interface] Graphmae: self-supervised masked garph autoencoders
Просмотров 24Месяц назад
- 발표자: 석사과정 4학기 강훈 - 본 영상은 ACM SIGKDD에서에 2022년 발표된 Graphmae: self-supervsied masked graph autoencoders” 연구를 요약 정리한 것입니다. 논문은 masked autoencoder 기반의 그래프 자기지도학습 방법론을 제안하였으며 대조학습 기반 및 다른 그래프 자기지도학습 방법론들보다 downstream task에서 높은 성능을 보였습니다.
[DS Interface] Driving the Technology Value Stream by Analyzing AppReviewsS. Das, N. Deb, N. Chaki a
Просмотров 19Месяц назад
발표자: 석사과정 3 학기 온드람입니다. 본 영상은 Transactions on Software Engineering journal에 2023년 발표된 “Driving the Technology Value Stream by Analyzing App Reviews” 연구를 요약 정리한 것입니다. 이 논문은 다양한 NLP 방법을 활용하여 앱 개발자들에게중요한 정보를 제공하기 의한 프레임워크를 제안하였습니다. - Link:ieeexplore.ieee.org/document/10109144
[DS Interface] Automated Keyword Filtering in Latent Dirichlet Allocation for Identifying Product At
Просмотров 24Месяц назад
- 발표자: 박사과정 5학기 현빈(XUAN BIN) - 본 영상은 journal of mechanical Design에 2021년 발표된 “Automated Keyword Filtering in Latent Dirichlet Allocation for Identifying Product Attributes From Online Reviews” 연구를 요약 정리한 것입니다. 이 논문은 온라인 제품 리뷰에서 제품 속성을 자동으로 식별하기 위한 새로운 방법을 제안합니다. 연구에서 잠재 디리클레 할당(LDA) 모델을 기반으로 하되, 키워드 필터링 과정을 자동화하여 LDA의 전처리 과정을 개선했습니다. 이 방법은 제품 매뉴얼을 활용하여 제품과 관련성이 높은 키워드를 자동으로 선별하고, 통계적 검정을 통해 유의미...
[DS Interface] Secure Outsourced Matrix Multiplication with Fully Homomorphic Encryption
Просмотров 34Месяц назад
-발표자: 석사과정 2학기 한상훈 -본 영상은 ESORICS 에 2023년 발표 된 "Secure Outsourced Matrix Multiplication with Fully Homomorphic Encryption" 연구를 요약 정리한 것입니다. 이 논문은 동혀암호중 RLWE 에 기반한 BGV,BFV,CKKS 등 에서의 동형 행렬 곱셈에 대한 연구에 대한 내용을 다루며, 기존에 정방행렬에서만 가능했던 행렬 대각화를 이용합니다. 특히 하나의 암호문에 여러 행렬을 담는 하이퍼 큐브 형태를 사용하여 정방행렬이 아닌 행 과 열이 모두 2의 멱승 꼴의 직서각형 에서 행렬 곱셈이 가능한 방식을 제안했습니다. - Link:https:qiangshenghua.github.io/papers/esorics23.pdf
[DS Interface] Meta-path analysis
Просмотров 20Месяц назад
- 발표자: 석사과정 3학기 황지영 - 본 영상은 Heterogeneous Information Networks(HIN)에서의 효과적인 노드 표현(node representation)을 위한 대표적인 방법론인 메타패스(metapath) 기반 접근법을 소개합니다. 메타패스를 HIN에 도입한 metapath2vec 모델을 시작으로, 어텐션(attention) 메커니즘의 등장에 따라 노드 및 메타패스 간의 가중치를 학습하는 HAN, MAGNN 모델을 소개하고, 마지막으로 메타패스를 사전에 설정하지 않고 효과적인 메타패스 생성 및 노드 표현을 학습하는 GTN 모델을 살펴봅니다. - Link: 1. Metapath2vec(Dong et al., 2017): dl.acm.org/doi/abs/10.1145/309...
[DS Interface] Causal Inference: Causation beyond Association
Просмотров 29Месяц назад
- 발표자: 석사과정 4학기 황정민 - 본 영상은 인과추론의 기본 개념과 전통적인 인과추론 방법론을 소개하는 Tutorial 영상입니다. 인과관계와 상관관계의 차이를 명확히 구분하고, 인과추론의 필요성을 설명하며, 반사실적 결과와 잠재적 결과의 개념을 강조합니다. 또한, 무작위 대조 실험과 관찰 데이터를 통한 인과추론기법인 Linear Regression, Subclassification, Matching, Propensity Score, DID 방법에 대해 다룹니다. - Link:matheusfacure.github.io/python-causality-handbook/landing-page.html?fbclid=IwAR1GvoWBE0WN0nXpbHas_5C2dr3QSp8ctqK7GsVQ370nN-G8...
[DS Interface] A survey on session-based recommender systems.
Просмотров 28Месяц назад
- 발표자: 석사과정 2학기 탁승연 - 본 영상은 ACM에 2021년 발표된 “ A survey on session-based recommender systems.” 연구를 요약 정리한 것입니다. 논문의 주요 내용인 세션 기반 추천시스템의 문제정의, 모델들을 소개하고 있습니다. 또한 본 영상은 세션 기반 추천시스템 모델 중 하나인 SR-GNN[1]에 대한 내용도 포함하고 있으며 세션 기반 추천시스템과 관련된 연구방향에 대해서도 짧게 소개하고 있습니다. [1] ojs.aaai.org/index.php/AAAI/article/view/3804
[DS Interface] Distribution Consistency based Self-Training for Graph Neural Networks with Sparse La
Просмотров 19Месяц назад
- 발표자: 석사과정 3학기 베이자 - 본 영상은 few-shot node classification 문제를해결하기 위한 Distribution-Consistent Graph Self-Training (DCGST) 프레임워크에 대해 설명합니다. Few-shot node classification은 레이블된 데이터가 부족하고, 레이블된 노드와 레이블되지 않은 노드 사이에 분포 차이가 발생해 그래프 신경망(GNN)의 성능을 저하시킬 수 있습니다. 이것을 해결하기 위해서 고급 Self-Training 방법을 제안하는 논문을 영상으로 설명합니다. - Link: dl.acm.org/doi/abs/10.1145/3616855.3635793?casa_tok en=-eDZQ1s2fvsAAAAA:PRIMc3UDfOiR...
[DS interface] Inherently Interpretable Time Series Classification via Multiple Instance Learning
Просмотров 25Месяц назад
- 발표자: 석사과정 2학기 최봉준 - 본 영상은 ICLR 2024 에서 발표된 “Inherently Interpretable Time Series Classification via Multiple Instance Learning” 연구를 요약 정리한 것입니다. 본 논문은 시계열 분류를 위해 Multiple Instance Learning(MIL)을 도입하여, 모델 예측 성능을 하락시키지 않으면서, 내재된 설명 가능성을 제공하는 MILLET(Multiple Instance Learning for Locally Explainable Time series classification)을 제안합니다. - Link:www.semanticscholar.org/paper/Inherently-Interpretable...
[DS Interface] UniHENN: Designing Faster and More Versatile Homomorphic Encryption-based CNNs withou
Просмотров 47Месяц назад
- 발표자: 학석사과정 2학기 최진아 - 본 영상은 2024년 IEEE Access에 발표된 “UniHENN: Designing Faster and More Versatile Homomorphic Encryption-based CNNs without im2col” 연구를 요약 정리한 것입니다. 이 논문은 동형 암호를 기반으로 한 CNN의 효율성을 향상시키기 위한 새로운 아키텍처인 UniHENN을 제안합니다. 특히, 기존 im2col 기법을 사용하지 않고도 다양한 CNN 모델에서 효율적인 추론이 가능하도록 설계되었습니다. 실험 결과, UniHENN은 빠른 추론 속도와 높은 적응성을 보여, 동형 암호를 활용한 프라이버시 보호 기반의 머신러닝에서 중요한 발전을 이뤄냈습니다. - Link:ieeexplore....
[DS Interface] The Efect of Latency on Movement Time in Path-steering
Просмотров 21Месяц назад
- 발표자: 석박사사통합과정 7학기 정재엽 - 본 영상은 ACM SIGCHI Conference on Human Factors in Computing Systems에 2024년 발표된 “The Efect of Latency on Movement Time in Path-steering” 연구를 요약 정리한 것입니다. 이 논문은 인터랙티브 시스템에 필연적으로 존재하는 지연율(latency)을 고려한 사용자 행동(steering) 모델을 분석 및 제안한 논문입니다. - Link:dl.acm.org/doi/pdf/10.1145/3613904.3642316
[DS Interface] Image editing Methods in Text2Image Generation
Просмотров 28Месяц назад
- 발표자: 석, 박사과정 6학기 차유호 - 본 영상은 Text2Image Generation 모델에서 객체 및 특정 개념을 수정하거나 지울 수 있는 방법들을 간략히 소개하는 영상입니다. 들어가기에 앞서, 이미지 생성 방법에 대한 간단한 개념을 정리합니다. 다음으로, 실제 Text2Image Generation 모델에서 활용할 수 있는 방법론인 1.Prompt-to-prompt, 2. Safe Latent Diffusion, Safe-CLIP의 연구요약을 통해 간단한 아이디어를 확인합니다. - Prompt-to-prompt: arxiv.org/abs/2208.01626 - Safe Latent Diffusion: openaccess.thecvf.com/content/CVPR2023/papers/Schr...
[DS Interface] Multi-Instance Causal Representation Learning for Instance Label Prediction and Out-o
Просмотров 27Месяц назад
발표자: 석사과정 4학기 장재석 - 본 영상은 2022년도 NeurIPS에 발표된 "Multi-Instance Causal Representation Learning for Instance Label Prediction and Out-of-Distribution Generalization"에 대한 내용을 요약 발표한 것입니다. 논문에서 제안하는 Causal MIL은 Bag에 대한 Instance의 종속적인 잠재변수를 식별 및 분리하는 iVAE를 통해 예측에만 유효한 정보를 활용해서 학습을 수행 및 예측을 수행합니다. Causal MIL은 특히, 23년도 NeurIPS에서 발표된 MIL에 대한 재현성에 대한 논문에서 표준 MIL 가정을 가장 잘 만족하는 모델로 알려져 있습니다. -Link:proceedi...
[DS Interface] Combining News Sentiment and Technical Analysis to Predict Stock Trend Reversal
Просмотров 19Месяц назад
[DS Interface] Combining News Sentiment and Technical Analysis to Predict Stock Trend Reversal
[DS Interface] User-oriented Fairness in Recommendation
Просмотров 30Месяц назад
[DS Interface] User-oriented Fairness in Recommendation
[DS Interface] On Tackling Explanation Redundancy in Decision Trees
Просмотров 23Месяц назад
[DS Interface] On Tackling Explanation Redundancy in Decision Trees
[DS Interface] Patent-based framework for assisting entrepreneurial firms’ R&D partner selection: Le
Просмотров 20Месяц назад
[DS Interface] Patent-based framework for assisting entrepreneurial firms’ R&D partner selection: Le
[DS Interface] BadCLIP: Dual-Embedding Guided Backdoor Attack on Multimodal Contrastive Learning
Просмотров 29Месяц назад
[DS Interface] BadCLIP: Dual-Embedding Guided Backdoor Attack on Multimodal Contrastive Learning
[DS Interface] SALUN: EMPOWERING MACHINE UNLEARNING VIAGRADIENT-BASED WEIGHT SALIENCY IN BOTH IMAGEC
Просмотров 23Месяц назад
[DS Interface] SALUN: EMPOWERING MACHINE UNLEARNING VIAGRADIENT-BASED WEIGHT SALIENCY IN BOTH IMAGEC
[DS Interface] Topic detection and text classification via compressive sensing theory
Просмотров 42Месяц назад
[DS Interface] Topic detection and text classification via compressive sensing theory
[DS Interface] Imbalanced Problem for Regression
Просмотров 37Месяц назад
[DS Interface] Imbalanced Problem for Regression
[DS Interface] SimpleNet: A Simple Network for Image Anomaly Detection and Localization
Просмотров 132Месяц назад
[DS Interface] SimpleNet: A Simple Network for Image Anomaly Detection and Localization
[DS Interface] CDI-E: an elastic cloud servicefor data engineering
Просмотров 38Месяц назад
[DS Interface] CDI-E: an elastic cloud servicefor data engineering
[DS Interface] FateZero: Fusing Attentions for Zero-shot Text-based Video Editing
Просмотров 31Месяц назад
[DS Interface] FateZero: Fusing Attentions for Zero-shot Text-based Video Editing
[DS Interface] Predicting and analyzing technology convergence for exploring technological opportuni
Просмотров 25Месяц назад
[DS Interface] Predicting and analyzing technology convergence for exploring technological opportuni
[DS Interface] LXMERT: Learning Cross-Modality Encoder Representations from Transformers
Просмотров 32Месяц назад
[DS Interface] LXMERT: Learning Cross-Modality Encoder Representations from Transformers
좋은 영상 감사합니다!
안녕하세요, 데이터사이언스학과 IXLAB 소속 석사과정 민예원입니다. 해당 논문은 기존 GAE 의 한계점을 극복하고자 노드와 노드 주변 이웃들의 정보를 활용하여 attributed graph 상에서 노드 이상치를 탐지하고, contrastive learning을 통해 낮은 연산량으로 높은 성능을 보였다는 점에서 참신한 contribution을 전달하고 있어 매우 인상 깊었습니다. 노드의 구조적 특성까지 고려하는 것이 중요하다는 것을 알게 된 시간이었습니다. 좋은 발표 감사드립니다 :)
안녕하세요, 데이터사이언스학과 IXLAB 소속 석사과정 민예원입니다. 좋은 발표 감사합니다. 기존 GNN의 표현력의 한계점을 극복하기 위해 Affinity measure를 도입하여 non-ismorphic 그래프 구별 문제를 해결했다는 점에서 참신한 contribution을 전달하는 것이 흥미로웠고, 다양한 극복 방법이 존재한다는 사실 또한 알게 되었습니다. 새로운 Message passing network을 제안하여 이론적으로 뛰어난 표현력과 실제 성능을 제공하며, 또한 대규모 그래프에도 적용이 가능하다는 점에서 실무적으로 활용도가 높을 것으로 기대됩니다. 감사합니다 :)
안녕하세요, 데이터사이언스학과 인터렉션 연구실 김대욱입니다. 발표 잘 들었습니다 .기존의 방법들이 상호 도메인과 도메인 내 대조 손실을 개별적으로 처리하면서 발생한 비효율성을 지적하고, 이를 단일한 공간으로 통합하는 UniCLIP의 접근은 매우 신선하고 실용적입니다. 다양한 모달리티 간의 통합적 학습 가능성을 탐구하는데 도움이 많이 될 것 같습니다. 감사합니다.
안녕하세요 데이터사이언스학과 인터렉션 연구실 김대욱입니다. 흥미로운 논문 주제로 발표해 주셔서 감사합니다. Cold Start 문제를 해결 방법으로 HACon이라는 전략방법을 설정하여 초기 질의가 기존의 능동 질의 전략을 크게 능가하고 랜덤 선택과 비교해서도 훨씬 우수한 성능을 보였고 이후 학습 절차의 효율성과 효과성을 결정한다는 Insights를 도출한 것이 매우 인상 깊었습니다. 감사합니다.
안녕하세요 데이터사이언스학과 인터렉션 연구실 석사과정 김대욱입니다. 본고에서 특히 CLIP 모델을 재활용하여 소리를 로컬라이징하는 기술적 접근이 매우 인상적입니다. 또한 매우 실용적이어서 추후에 실용적인 제품으로 제작될 수 있는 가능성이 높아서 연구가 더 와닿았습니다. 또한 연구 방법에서 User study 뿐만 아니라 Expert study를 통해 연구의 타당성을 올렸던 점도 눈에 띄었습니다. 발표 잘 들었습니다. 감사합니다.
안녕하세요 데이터사이언스학과 인터렉션 연구실 석사과정 김대욱입니다. 발표 잘 들었습니다. AR 환경에서 사용자가 익숙한 스마트폰 타이핑 경험을 재현함으로써, 성과적인 측면에서 스마트폰에 비해서 떨어지지만 기존 HMD에서 보다는 텍스트 입력의 효율성이 더 높을 것으로 예상되며 생각보다 낮은 오류율을 달성한 점이 인상 깊었습니다. 연구에서 다른 키보드 자판 형식도 함께 비교했으면 더욱 더 좋았을 것 같습니다.
안녕하세요 인터렉션 연구실 소속 김대욱입니다. 발표 잘 들었습니다. 텍스트 인코더와 이미지 디코더 간의 강한 결합으로 인해, 기존 모델에서는 새로운 기능을 추가하거나 업그레이드하는 것이 매우 어려웠던 점의 한계를 뛰어넘고 또한 과정이 제한된 자원으로 이루어진다는 점에서, GlueNet의 효율성과 실용성이 돋보였던 점이 매력적이었습니다. 감사합니다.
안녕하세요. 서울과학기술대학교 BIGBASE 연구실 석사과정 문지훈입니다. class-incremental에서의 위한 객체 감지와 같은 실제 시나리오를 포함한 여러 벤치마크에서 제안된 방법에 대한 성능을 평가한 것이 되게 견고한 방법이라고 생각합니다. Memory-replay 방식이 continual learning 뿐만아니라 제 연구분야인 prototype learning에서도 효과적으로 사용될 수 있을 것 같습니다. 다만 데이터 불균형 상황에서의 성능도 괜찮게 나올 지 궁금합니다.
안녕하세요. 서울과학기술대학교 BIGBASE 연구실 석사과정 문지훈입니다. 실제 환경에서는 데이터가 long-tailed된 상황이 매우 많은데 여기에 사용되는 데이터 불균형 해소 방법들 중 Oversapling에 대한 SMOTE에 대한 설명을 자세히 해주셨습니다. 개념이나 적용은 대충 알고 있었지만 자세한 작동원리나 한계는 몰랐는데 덕분에 다음에 활용할 일이 있으면 무작정 SMOTE를 사용하지 않고 한계를 고려하여 다른 방법이나 관련 연구를 찾아 볼 것 같습니다. 잘 들었습니다.
안녕하세요. 서울과학기술대학교 BIGBASE 연구실 석사과정 문지훈입니다. 많이 활용될 여지가 있는 AI 모델과 fing-grained한 특징을 잡아야하는 의학에서의 AI를 접목하기 위한 Attention기반의 모델을 처음 접했는데, 모델의 additive nature과 pathology slide의 각 patch가 최종 예측에 기여하는 정도를 정확하게 계산하고 시각화하는 점이 특히 실용적일 수 있을 것 같다고 생각했습니다
안녕하세요. 서울과학기술대학교 BIGBASE 연구실 석사과정 문지훈입니다. 발표 잘 들었습니다. 구글 파일 시스템에서의 fault tolerance, scalability, and high throughput에 대한 최적화와 같은 설계 원칙은 많은 방대한 데이터 세트를 처리하기 위한 표준으로 설정한 점이 이후 분산 시스템에 영향을 준 것 같습니다. 프레젠테이션에서의 분산 시스템에 역사를 잘 풀어주신 것 같아 재밌게 들었습니다
안녕하세요. 서울과학기술대학교 BIGBASE 연구실 석사과정 문지훈입니다. Graphormer 모델의 다른 잠재적인 약점이나 개발 과정에서 매우 큰 graph에서의 scalability 문제, 작은 데이터 세트에서의 잠재적 overfitting 같은 문제들은 어떻게 해결 하는 지 궁금합니다.
안녕하세요, 데이터사이언스학과 IXLAB 연구실 석사과정 민예원입니다. Correlation-Guided Detection Transformer(CG-DETR)를 도입하여 관련성이 낮은 비디오가 텍스트 쿼리에 의해 과도하게 표현되지 않게 비디오 클립과 단어 간의 상관관계를 추론하여 높은 수준의 결과를 이끌어 냈다는 점에서 흥미롭습니다. 텍스트-비디오 분야에서 텍스트 설명의 중요성을 다시 알게 되었습니다. 좋은 발표 감사드립니다!
안녕하세요, 데이터사이언스학과 IXLAB 연구실 석사과정 민예원입니다. transformer4rec library가 추천시스템에서 side information의 효과성을 증진시킨다는 점에서 흥미로웠습니다. 다양한 도메인에서 해당 라이브러리를 폭넓고 유용하게 사용할 수 있을 것이라고 생각됩니다. 추후에 추천 시스템의 발전에 있어서 더 다양한 견해들을 폭넓게 이야기해주시면 더욱 좋을 것 같습니다! 좋은 발표 감사합니다 :)
안녕하세요 데이터사이언스학과 석사과정 허준봉입니다. LSTM autoencoder에 대해 설명을 해주셨는데요. LSTM autoencoder는 reconstruction error를 기반으로 threshold보다 크면 이상이라고 판단하는 이상치 탐지 방법입니다. 하나 궁금한거는 실험에서 사용된 데이터셋이 대표적인 단변량 데이터셋인데요. LSTM autoencoder기법이 다변량 데이터셋에도 이용이 가능한지 궁금합니다. 감사합니다.
안녕하세요, 데이터사이언스학과 석사과정 IXLAB 연구실 민예원입니다. 흥미로운 발표 감사드립니다. Active Learning의 개념을 획득하고, 효율적인 데이터 선별의 중요성을 알게 되었습니다. 특히, 의료 Active leaning에서 Cold Start 문제를 해결하기 위한 새로운 접근 방식인 HaCon을 제안했다는 점에서 초기 데이터 선택 과정에서 초기 쿼리 선택의 중요성을 파악하게 되었습니다. 감사합니다!
안녕하세요. 데이터사이언스학과 석사과정 허준봉입니다. 발표 잘 들었습니다. 본 논문은 제목 그대로 transformer 모델들이 시계열 예측을 할 때 효과적인지 의문을 두고 실험한 내용의 논문인 것 같고 transformer 기반 시계열 예측 모델인 informer, autoformer, fedformer 등 간략하게 설명해주셔서 감사합니다. 감사합니다.
안녕하세요 데이터사이언스학과 허준봉입니다. 발표 잘 들었습니다. 기존의 딥러닝 모델들은 우수하지만 해석력이 떨어지지만 본 논문에서는 Tabnet은 의사결정나무의 변수 선택 특징과 딥러닝 모델의 장점이 결합되어서 인지 성능도 우수하고 해석력도 우수하다는 측면이 있군요. 정형 데이터 관련 좋은 딥러닝 모델 설명해주셔서 감사합니다. 감사합니다.
안녕하세요 데이터사이언스학과 허준봉입니다. 저도 최근에 메타러닝에 대해 공부하고 있는데 메타러닝 기법 중 하나가 few shot learning이라는 것을 알고 있습니다. 그래서 중간에 mult-task learning이 나와서 의아했는데요. multi task learning에 few shot learning이 이용된다고 이해했는데 맞나요? 전 meta learning과 multi task learning은 서로 다른거라서 구별이 되는걸로 알고 있는데요. 혹시 사례가 있으면 알려주시면 감사하겠습니다. 감사합니다.
안녕하세요, 데이터사이언스학과 석사과정 정원렬입니다. Contrastive learning을 활용하여 In-distribution 데이터의 임베딩 공간과 OOD(Out-of-Distribution) 임베딩 공간 사이의 거리를 넓히는 방식으로 OOD를 탐지하는 방법이 매우 인상적이었습니다. 특히, Projection Head와 Encoder에서 추출된 모든 정보를 활용하여 Total Loss를 적용하는 접근이, 모델에서 얻을 수 있는 정보를 최대한 활용하여 효과적으로 OOD 탐지 방법론을 구성한 점이 매우 인상 깊었습니다. 좋은 연구 소개 감사합니다.
안녕하세요 데이터사이언스학과 석사과정 허준봉입니다. 저도 클래스 imbalance가 심한 데이터셋으로 프로젝트를 할 때 Smote를 이용해봤는데 되려 F 1 score와 AUC score가 오히려 떨어지는 경우를 본 적이 있습니다 . 이러한 Smote의 한계를 해결하기 위해 Smote 관련 여러 연구들을 발표해주셔서 감사합니다. 감사합니다.
안녕하세요, 데이터사이언스학과 석사과정 정원렬입니다. 김정현님의 발표 잘 들었습니다. Transformer의 Long Sequence 처리에서 발생하는 비효율성을 극복하기 위해 Mamba가 제안된 점이 매우 흥미로웠습니다. 특히 Selective SSM을 통해 Transformer++의 성능을 능가하고, 하드웨어 병렬 알고리즘을 활용하여 학습 효율성을 극대화한 점이 인상적이었습니다. Mamba가 Transformer보다 5배 빠른 Inference 성능을 보이면서도 긴 시퀀스 처리에서 뛰어난 성능을 발휘하는 점에서, 앞으로 다양한 Foundation 모델의 백본으로 활용될 가능성이 매우 기대됩니다. 좋은 발표 감사합니다.
안녕하세요, 데이터사이언스학과 석사과정 정원렬입니다. 발표 잘 들었습니다. 이번 연구에서 GNN의 한계를 극복하기 위해 Affinity measure를 도입한 접근법이 매우 인상적이었습니다. 특히, non-isomorphic 그래프를 구별하는 데 있어서 이 방법이 얼마나 효과적인지 알 수 있었습니다. 그래프 구조 학습에 effective resistance, hitting time 등의 개념을 적용하여 GNN의 표현력을 강화하는 방식이 매우 혁신적이라고 생각합니다. 대규모 그래프에도 효율적으로 적용할 수 있다는 점에서 실무적 응용 가능성도 높아 보입니다. 좋은 발표 감사합니다.
안녕하세요, 데이터사이언스학과 석사과정 정원렬입니다. 발표 잘 들었습니다. Local Module Composition (LMC) 접근법을 통해 연속 학습의 주요 문제들을 해결하려는 시도가 매우 인상적이었습니다. 특히, 모듈 간의 동적 조합을 통해 작업 ID에 구애받지 않고도 성능을 유지하며, 입력 분포 변화를 감지해 새로운 모듈을 추가하는 메커니즘이 혁신적이라고 생각합니다. 이 연구는 인공지능 시스템의 지속적 학습 능력을 한층 더 발전시키는 데 큰 기여를 할 것으로 기대됩니다. 좋은 발표 감사합니다.
안녕하세요, 데이터사이언스학과 석사과정 정원렬입니다. 발표 잘 들었습니다. 이번 연구에서 제안된 Contrastive Learning 기반의 노드 이상치 탐지 방법이 매우 인상적이었습니다. 특히, 노드의 구조적 특성과 속성을 모두 고려하여 이상치를 효과적으로 탐지할 수 있다는 점이 흥미로웠습니다. 이를 통해 기존의 GAE 기반 알고리즘의 한계를 극복할 수 있었으며, 라벨링이 없는 데이터에서도 높은 성능을 보인다는 점에서 다양한 실무 응용 분야에서의 활용 가능성을 기대하게 됩니다. 좋은 발표 감사합니다.
안녕하세요, 빅데이터 관리 및 응용 연구실 박사과정 박강민 입니다. 좋은 발표 감사드립니다. 본 논문에서는 비정형 특허 텍스트를 해석 가능한 공간 표현으로 매핑하는 생성적 AI 접근법인 InnoVAE를 제안한 점이 주목할 만합니다. 재밌게본 점은 특허의 벡터 표현을 학습하고 이를 "disentangled" 공간에 배치하여 관리자의 직관과 행동을 용이하게 한 점, AI 특허에 적용하여 기업의 AI 기반 IP 포트폴리오를 특성화하는 해석 가능한 측정 방법을 제시한 점, 기술 경관 생성, 비정형 텍스트에서 새로운 특징 엔지니어링, 특허 출원 보강 등 다양한 활용 사례를 제시한 점 입니다. 이 연구는 생성적 AI 방법을 통해 기업 데이터베이스에 저장된 방대한 양의 비정형 텍스트를 실행 가능한 형태로 변환할 수 있는 잠재력을 보여주고 있어, 기업의 혁신 관리 및 특허 전략 수립에 큰 기여를 할 것으로 보입니다.
안녕하세요, 빅데이터 관리 및 응용 연구실 박사과정 박강민 입니다. 좋은 발표 감사드립니다. 본 논문에서는 연속 학습(Continual Learning) 문제를 해결하기 위한 새로운 모듈화 접근법인 Local Module Composition (LMC)을 제안한 점이 주목할 만합니다. 특히 다음 세 가지 측면이 인상적이었습니다. 각 모듈에 로컬 구조 구성 요소를 제공하여 입력에 대한 모듈의 관련성을 추정하는 방식을 도입한 점, 모듈 특정적인 구조 학습을 통해 작업 ID에 구애받지 않는 방식을 구현한 점, 입력 분포에 대한 통계를 추적하고 이상치 샘플 감지 시 새 모듈을 추가하는 메커니즘을 구현한 점. 이 연구는 연속 학습의 주요 과제인 치명적 망각, 작업 간 전방 및 후방 전이, 서브 선형 모델 성장 등을 해결할 수 있는 새로운 접근법을 제시하고 있어, 인공지능의 지속적 학습 능력 향상에 큰 기여를 할 것으로 보입니다.
안녕하세요, 빅데이터 관리 및 응용 연구실 박사과정 박강민 입니다. 좋은 발표 감사드립니다. 본 논문에서는 Stable Diffusion과 같은 확산 모델의 데이터 복제 문제를 분석하고 이를 해결하기 위한 방법을 제안한 점이 주목할 만합니다. 텍스트 조건부 확산 모델에서 데이터 복제 문제를 체계적으로 분석한 점, 텍스트 조건이 데이터 복제에 중요한 역할을 한다는 새로운 발견을 제시한 점, 훈련 데이터셋의 이미지 캡션을 무작위화하고 증강하는 기법을 통해 데이터 복제를 줄이는 방법을 제안한 점들이 의미있었던 것 같습니다. 이 연구는 생성 모델의 윤리적 사용과 저작권 문제에 대한 중요한 통찰을 제공하고 있어, AI 윤리 및 공정성 분야에 큰 기여를 할 것으로 보입니다.
안녕하세요, 빅데이터 관리 및 응용 연구실 박사과정 박강민 입니다. 좋은 발표 감사드립니다. 본 논문에서는 비디오 시간적 그라운딩 문제를 해결하기 위해 Correlation-Guided Detection Transformer (CG-DETR)를 제안한 점이 주목할 만합니다. 특히 다음 세 가지 측면이 인상적입니다. 더미 토큰을 활용한 적응형 교차 주의 계층을 설계하여 관련성이 낮은 비디오 클립이 텍스트 쿼리에 의해 과도하게 표현되는 것을 방지한 점, 비디오 클립과 단어 간의 세밀한 상관관계를 추론하여 교차 주의 맵을 가이드하는 방식을 도입한 점, 모멘트 적응형 현저성 감지기를 사용하여 각 비디오 클립의 텍스트 참여 정도를 활용한 점. 이 접근법은 모멘트 검색과 하이라이트 감지 벤치마크에서 최고 수준의 결과를 달성했다고 하니, 비디오-텍스트 상호작용 분야에 큰 기여를 할 것으로 보입니다.
안녕하세요, 빅데이터 관리 및 응용 연구실 박사과정 박강민 입니다. 좋은 발표 감사드립니다. 본 논문에서 지도학습의 클래스 구분 능력과 대조학습의 인스턴스 수준 표현 학습을 결합한 점, 라벨 정보를 활용해 false negative 문제를 해결한 점, 동적 라벨 메모리 뱅크와 모멘텀 업데이트 인코더를 도입한 점이 주목할 만한 점인 것 같습니다. 이 접근법은 기존 지도학습 방법들보다 높은 정확도를 달성했다고 하니, 컴퓨터 비전 분야에 큰 기여를 할 것으로 보입니다. 다만, 계산 복잡도나 다양한 데이터셋에서의 성능 등 추가적인 분석이 있으면 더 좋았을 것 같습니다.
안녕하세요, 데이터사이언스학과 석사과정 김지민입니다. 좋은 논문 발표 잘 들었습니다. setence embedding에 관한 논문으로 labelled training data가 필요없는 문장 임베딩을 위한 self-supervised objective 제안하고 transformer 베이스의 pretraining 된 모델과 함께 사용하면 라벨을 사용한 지도학습 성능과의 격차를 줄이고 임베딩 퀄리티는 모델과 데이터 사이즈에 따라 더 좋은 향상을 보여준다는 점에서 흥미로웠습니다. 좋은 발표 해주셔서 감사합니다.
안녕하세요, 데이터사이언스학과 석사과정 김지민입니다. 최근 sequential recommendation approach에 대한 연구가 많다는 점을 들어봐서 그런지 이와 관련된 논문 영상을 잘 들었습니다. Transformers4Rec 라이브러리로 sequential and session-based recommendation task를 빠르고 쉽게 개발하는 방법인 세션 위주의 추천 시스템에 적합한 새로운 방법에 대해 소개해 주셔서 감사합니다. 또한 side information을 추가하는 방법도 알게 되었습니다. 이 연구를 통해서 여러 연구자들이 쉽게 접근해서 활용할 수 있을 것 같습니다. 감사합니다.
안녕하세요, 데이터사이언스학과 석사과정 김지민입니다. 좋은 연구 설명 잘 들었습니다. Additive MIL이 기존의 MIL 구조에 그대로 적용 가능하며 슬라이드 전체에 대한 예측 성능이 기존 방식과 비슷하거나 더 뛰어나다는 점이 흥미로웠습니다. Attention MIL을 잘 모르고 있었는데 방식과 어텐션과 데이터에 대한 예측 사이에 비선형적이며, 인스턴스들의 예측 방향성을 확인할 수 없다는 한계에 대해서도 알게 되었고 재정의를 통해 구현되는 Additive MIL을 통해 한계를 해결하였다는 것도 알게 되었습니다. 좋은 발표 해주셔서 감사합니다.
안녕하세요. 데이터사이언스학과 석사과정 김지민입니다. GAN 기반의 데이터 증강과 DNN 분류기를 사용하여 제한된 샘플로 신 기술을 효과적으로 예측하는 접근법에 대해 잘 들었습니다. 딥러닝 분류기를 통해 예측 모델에 외부 도메인을 임베딩할 때 기존의 접근법에 대해서만 알고 있었지만 이번 영상을 통해 제안한 접근법으로 효과적으로 예측할 수 있는 방법을 알게 되어서 좋은 정보를 얻어가는 것 같습니다. 또한 GETHC 및 IT 특허 데이터베이스의 샘플 데이터를 이용하였다는 점도 흥미로웠습니다. 좋은 논문을 소개해주셔서 감사합니다.
안녕하세요, 데이터사이언스학과 석사과정 김지민입니다. 기존의 GNN의 표현력이 non-isomorphic 그래프를 구별하는데 한계가 있어 랜덤워크 기반의 Affinity measure를 활용하여 모델의 성능을 향상시킨 Message passing network로 성능을 향상시킬 수 있다는 점을 알게 되었습니다. 대규모 그래프에도 적용이 가능하다는 점이 가장 좋게 느껴지네요. 이번 영상을 통해 GNN의 한계와 향상시킬 수 있는 방법을 알게 되었습니다. 좋은 설명 감사합니다.
안녕하세요, 데이터기반사용자분석 연구실 석사과정 문상혁입니다. 좋은 발표 감사합니다. 모듈성을 활용한 연속 학습 접근법인 LMC를 제안하여, 모듈 간의 동적 조합을 통해 여러 과제에서의 성능을 향상시켰다는 점과 과제 ID 없이도 효과적으로 동작하며, 입력 분포 변화를 감지해 새로운 모듈을 추가하는 점이 인상적입니다.
안녕하세요. 데이터시반사용자분석 연구실 석사과정 문상혁입니다. 텍스트 설명에 따라 비디오 클립을 효과적으로 식별하는 CG-DETR 모델에 대한 발표 잘 들었습니다. 교차 모달 주의 메커니즘을 통해 관련 클립을 강조하고, 세밀한 상관 관계를 추론하여 성능을 크게 향상시킨 점이 인상적입니다.
안녕하세요. 데이터시반사용자분석 연구실 석사과정 문상혁입니다. 연합 학습에서 관련 데이터를 선택하여 글로벌 모델 성능을 향상시키는 FLRD 접근법에 대한 발표 잘 들었습니다. 각 클라이언트가 자체적으로 관련 데이터를 선택하는 모델을 학습하도록 하여, 실험 결과 이 접근법의 효능을 입증한 점이 인상적입니다.
안녕하세요. 데이터시반사용자분석 연구실 석사과정 문상혁입니다. 발표 재밌게 들었습니다. Transformer 기반 Graphormer 모델을 통해 그래프 표현 학습에서 탁월한 성능을 입증하며 구조적 정보를 효과적으로 인코딩하는 방법을 제안하여 GNN 변형들을 포함할 수 있는 강력한 모델을 제시한 점이 인상적입니다.
안녕하세요, 데이터기반사용자분석 연구실 석사과정 문상혁입니다. 좋은 발표 감사합니다. 고객의 필요를 이진 분류에서 토큰 분류로 재개념화하여 구체적인 요구사항을 추출하는 방법을 제시한다는 점과 이를 통해 제품 개발에서 효율성을 크게 향상시킬 수 있는 가능성을 보여준다는 점이 인상적이였습니다.
안녕하세요. 데이터 기반 사용자 분석 연구실 석사과정 윤민석입니다. 좋은 발표 감사드립니다. GFS는 대규모 데이터 처리 워크로드를 지원하기 위한 혁신적이고 실용적인 접근 방식을 보여줍니다. 특히 저비용 상용 하드웨어에서의 높은 성능과 장애 내성은 매우 인상적입니다. 마스터와 청크서버 간의 데이터 전송 분리를 통해 병목현상을 최소화한 점도 주목할 만합니다. 이번 영상을 통해 분산 파일 시스템과 시스템 최적화에 대한 중요성을 알게 되었습니다.
안녕하세요. 데이터 기반 사용자 분석 연구실 석사과정 윤민석입니다. 좋은 발표 감사드립니다. DreamerV3는 강화 학습의 경계를 넓히는 중요한 진전을 보여줍니다. 특히, Minecraft라는 게임에서 실험을 통해 다이아몬드를 수집한 성과는 신기하고 놀랍습니다. 다양한 작업에서 단일 설정으로 작동한다는 점에서 실용성과 범용성을 입증했으며, 이는 강화 학습의 실제 적용 범위를 크게 확장할 수 있습니다. 이러한 성과를 바탕으로 DreamerV3가 실제 복잡한 현실 세계 문제에서도 동일한 성과를 낼 수 있을지 궁금합니다. 이 알고리즘이 다양한 도메인에서 어떻게 일반화될 수 있는지 추가 연구가 필요할 것 같습니다.
안녕하세요. 데이터 기반 사용자 분석 연구실 석사과정 윤민석입니다. 좋은 발표 감사드립니다. LCL 모델은 감독 학습과 대조 학습의 강점을 결합하여 이미지 분류 정확도를 크게 향상시킨 점이 매우 인상적입니다. 특히, 다양한 벤치마크에서 경쟁력을 보였다는 점에서 실용성이 높다고 생각됩니다. 다만, 복잡한 구조와 긴 훈련 시간이 단점으로 작용할 수 있어, 이를 개선할 방법을 모색하는 것도 중요할 것 같습니다. 다른 비전 작업에서의 LCL 모델의 적용 가능성을 탐구하는 향후 연구도 기대됩니다.
안녕하세요. 데이터 기반 사용자 분석 연구실 석사과정 윤민석입니다. 좋은 발표 감사드립니다. 이 논문은 텍스트 임베딩의 보안 문제를 매우 철저하게 분석하고 있으며, Vec2Text를 통해 임베딩이 실제 텍스트와 거의 같은 양의 개인 정보를 누출할 수 있음을 입증한 점이 매우 인상적입니다. 특히, 의료 데이터에서 임상 정보를 복원할 수 있다는 점은 큰 우려를 불러일으킵니다. 이 연구는 임베딩을 민감한 데이터로 간주하고 보호해야 한다는 중요한 메시지를 전달하고 있습니다. 앞으로 임베딩의 보안 강화를 위한 추가 연구가 필요하며, 이 논문은 그 방향을 제시하는 중요한 기여를 하고 있습니다.
안녕하세요. 데이터 기반 사용자 분석 연구실 석사과정 윤민석입니다. 좋은 발표 감사드립니다. active learning의 효율성 문제, 특히 초기 단계에서의 데이터 선택 문제를 실험을 통해 확인할 수 있었습니다. 초반 선택에서 무작위 선택보다 효율성이 떨어지는 cold start 문제를 잘 정의하고, 이를 해결하기 위한 새로운 전략인 HaCon을 제안한 점이 인상적입니다. 특히, 대조 학습의 장점을 활용하여 주석 없이도 라벨 다양성을 확보하고, 전형적인 데이터를 식별하는 방법이 참신합니다. HaCon 전략이 의료 영상 분류뿐만 아니라 다른 분야에서도 같은 성과를 낼 수 있을지 궁금합니다!
안녕하세요. 빅데이터 관리 및 응용 연구실 석사과정 김다연입니다. 발표 잘 들었습니다. 작은 쿼리들을 효율적으로 처리하기 위해 제안된 QaaD 기술이 인상적이었습니다. 특히, Spark가 작은 쿼리들로 인한 I/O와 성능 문제를 겪고 있다는 점을 해결하기 위해 microRDD를 활용한 쿼리 병합 및 동적 파티션 크기 조정하는 것이 흥미로웠습니다. 감사합니다.
안녕하세요. 빅데이터 관리 및 응용 연구실 석사과정 김다연입니다. 우선 발표 잘 들었습니다. 추천 시스템에서 트랜스포머 아키텍처를 활용한 연구가 인상적이었습니다. Transformers4Rec를 통해 트랜스포머 아키텍처의 장점을 통해 추천 시스템의 성능이 크게 향상될 것으로 기대됩니다. 이 연구가 추천 시스템의 발전에 기여하고, 더 많은 실용적인 적용 사례를 제시할 수 있을 것입니다. 감사합니다.
안녕하세요. 빅데이터 관리 및 응용 연구실 석사과정 김다연입니다. 발표 잘 들었습니다. Continual Learning에서 망각 문제를 극복하기 위해 memory replay와 데이터 압축을 활용한 방식이 인상적이었습니다. 해당 연구가 Continual Learning 및 데이터 저장의 효율성을 높이고, 실제 적용 가능성을 넓히는 데 기여할 것으로 기대됩니다. 감사합니다.
안녕하세요. 빅데이터 관리 및 응용 연구실 소속 김다연입니다. 우선 발표 잘 들었습니다. 텍스트 임베딩을 통해 원본 텍스트를 92%까지 복원한다는 것이 흥미로웠습니다. 만약 복원할 토큰을 수천 개의 토큰으로 확장시킨다면 기술적으로 어떤 시도를 할 수 있는지 궁금합니다. 감사합니다.