DataFlow

머신러닝 데이터 모델링 소프트웨어

DataFlow는 현장에서 수집된 계측 데이터를 기반으로 한 모델 생성 및 학습을 위해 개발된 머신러닝 알고리즘 데이터 모델링 소프트웨어입니다.
DataFlow를 이용하여 플랜트 유입 및 처리수질 예측, 분리막 오염 분석 등 다양한 계측기반 환경분야에 활용할 수 있습니다.

손쉬운 시작

DataFlow는 스프레드시트에서 데이터 조회 및 편집이 가능하며, 간단한 설정만으로 손쉽게 데이터를 분석할 수 있습니다.

  • 엑셀 (xls, xlsx) 또는 텍스트 (csv) 파일 데이터 불러오기
  • 학습 알고리즘 파라미터 기본값 제공을 통한 간편한 모델 학습 수행
  • 학습된 모델 및 예측 결과 저장 / 불러오기
  • 모델별 학습 설정 기본값 최적화
  • 사용자 필요에 따라 알고리즘 파라미터 수정 가능
  • 데이터 전처리 기능 (입 · 출력 항목 중 데이터 변동이 없는 항목, 이상치 제거 등)
  • 학습 및 테스트 데이터 선택 기능 (순차, 무작위, 지정)
  • 다수 모델 동시 학습, 학습 결과 요약 지원
  • 한글 메뉴 및 사용자 지침서 지원
  • 온라인 업데이트 지원

입력항목 선택 최적화

DataFlow는 학습 모델의 다양한 입력항목 조합에 따른 모델 학습결과를 비교하여 최적 모델을 선정합니다.

  • 모델의 입력항목 개수 범위 지정
  • 입력항목의 조합별 모델링 전체 수행
  • 학습결과 성능이 우수한 순으로 결과 표시
  • 성능이 우수한 모델이 많이 포함된 변수 추출
  • 분석결과 복사 및 내보내기

기초 통계 분석

DataFlow는 엑셀형태로 구성된 사용자 데이터의 평균, 분산, 표준편차 등 단변량 통계량 연산과 주성분분석, 상관관계분석 등 다변량 데이터 분석기능을 제공하며, 예측 / 분류 모델의 입력항목을 선정하는데 도움이 되는 사전 분석을 수행할 수 있습니다.

  • 기초통계량 (평균, 분산, 표준편차, 최대값, 최소값, 중간값 등)
  • 주성분 분석 (PCA : Principal Component Analysis) 및 Score 변수 추가
  • 상관관계 분석 (CA : Correlation Analysis)
  • 데이터 변환 (Log, Power, Lead, Lag 등) 변수 추가

다양한 분석 기능 제공

DataFlow는 모델링 목적에 맞게 사용할 수 있도록 다양한 회귀분석, 분류분석, 군집분석 알고리즘을 제공합니다.
각 알고리즘의 설정값은 다양한 사례로부터 도출된 최적값을 사용합니다.

회귀분석 (Regression Analysis)
  • PLS (Partial Least Squares)
  • SVM (Support Vector Machine)
  • MLP (Multi-Layer Perceptron)
  • MLR (Multivariate Linear Regression)
  • RANSAC (Random Sample Consensus)
분류분석 (Classification Analysis)
  • PLS-DA (PLS – Discriminant Analysis)
  • DT (Decision Tree)
  • Neural Network
  • KNN (K-Nearest Neighbor)
  • Kernel-SVM
군집분석 (Clustering Analysis)
  • K-Means
  • Balanced K-Means

WaterFlow 구매 문의

지금 바로 시작하세요.
TRIAL
(1개월)
COMMERCIAL
(4,400,000원/년)
PERPETUAL
(별도 견적)
DataFlow 데스크탑
계정신청 구매문의 별도문의

※ 대학 강의 목적으로 사용하는 경우 무료이며, 별도 문의하여 주시기 바랍니다.
※ DataFlow 는 2023년 1월 1일부터 가격이 4,400,000원/년 (VAT 포함)으로 인상되었습니다.