분류 전체보기
-
Machine Learning with Python - IntroData Science 2022. 8. 18. 17:50
Python libraries for machine learning Numpy, Pandas, Scikit-learn Scikit-learnd의 기능: preprocessing, model_selection, building classifier, fitting the model, confusion_matrix (결과 출력) Supervised vs Unsupervised learning(지도학습 vs 비지도학습) Supervised model: how to teach? by labeling the dataset Unsupervised learning techniques: Dimension reduction / Density estimation / market basket analysis / Cluster..
-
goodFeaturesToTrack method 이용해 코너 검출시 Can't parse 'center'. Sequence item with index 0 has a wrong type 에러Data Science 2022. 8. 14. 14:47
OpenCV - 코너 검출 공부중 다음과 같은 에러가 떴다. 코너 검출은 코너점들이 영상이나 이미지에서 고유한 특징을 갖고 있을 경우 변별력을 두기 위해서다. 이미지 인식 등에 쓰인다. 기존 코드 # 23강 - 코너 검출 import cv2 import numpy as np src = cv2.imread("cup.webp") dst = src.copy() gray = cv2.cvtColor(src, cv2.COLOR_RGB2GRAY) # 하얀색 객체 검출, 배경은 검은색, 검출하려는 물체는 하얀색으로 변형 corners = cv2.goodFeaturesToTrack(gray, 100, 0.01, 5, blockSize=3, useHarrisDetector=True, k=0.03) # 코너 검출. 코너 품..
-
Data Analysis with Python - Module Evaluation & Learning ObjectviesData Science 2022. 8. 13. 18:16
In sample evaluation의 단점: it does not tell us how well the trained model can be used to predict new data Solution? Separate the data to two dataset (Training set, Testing set) First we build our data with training set, then use testing set to assess the our model Training data를 많이 넣을수록 Generalization error 이 발생할 가능성이 높아짐 / 때문에 여러 training data & testing data set를 넣어서 이를 보완한다. 이를 Cross validation..
-
Data Analysis with Python - Model DevelopmentData Science 2022. 8. 13. 18:08
A model can be thought of as a mathematical equation used to predict a value given one or more other values More relevant data → more accurate model 3 types of linear Regression Simple linear regression Multiple linear regression Polynomial regression Simple linear regression: The method to help us understand the relationship between two variables Multiple linear regression: The method to help u..
-
Data Analysis with Python - Exploratory Data AnalysisData Science 2022. 8. 13. 17:57
Descriptive statistics: Giving summaries about the sample and measures of the data 판다스 라이브러리를 이용해 data summarizing 하는 방법: df.describe() # Any NaN data are automatically skipped in these statistics To return counts of unique values: value_counts() 표에 넣어서 도출하는 법: to_frame() Box plot: Scatter Plot: shows the relationship between two variables Predictor/independent variable on x axis Target variable..
-
Data Analysis with Python - Data WranglingData Science 2022. 8. 13. 17:28
Data Wrangling 이란 raw data를 보다 쉽게 분석할 수 있다고 정리하고 통합하는 과정이다 칼럼 추가하는 법 file_name = "파일.csv" df = pd.read.csv(file_name) df['column'] = df['column']+1 Missing data는 어떻게 처리하나? How to drop missing values? df.dropna() # df is the dataframe df.dropna(subset = ['price'], axis = 0, inplace = True) # 와 df = df.dropna(subset=['price'], axis=0) # 은 같다 Make sure that inplace = True How to replace missing val..
-
Data analysis with Python - Importing datasetData Science 2022. 8. 13. 17:12
Data analysis with Python by IBM 시리즈 - 1강 Importing dataset Python packages for Data Science Scientifics computing: Pandas / Numpy / SciPy Visualization: Matplotlib / Seaborn Algorithmic libraries(Linear Regresion등에 쓰임): Scikit-learn(머신러닝 라이브러리) / Statsmodels(Estimate statistical models, perform statistical test) Datatype 비교: Pandas vs Python dataframe.describe() 은 숫자가 아닌 columns은 생략한다. 때문에 stri..
-
에티오피아 항공기 추락: B737-8 MAX 운용중인 항공사는?항공 관련 2019. 3. 19. 01:32
에티오피아 항공 302편이 3월 10일 Ejere 부근에 추락했습니다. 사고기는 B737-8 MAX, 라이언에어 610편 사고로 유명해진 기종입니다. 라이언에어 610편에 대한 포스팅은 링크 참고 https://criminal09.tistory.com/7예비 보고서가 4월 안으로 나올 예정이라 지금으로서는 짐작하기 힘들지만, 라이언에어 610편에서도 문제가 되었던 MCAS 시스템이 원인이 된 것으로 보입니다. 현재 프랑스 항공사고조사위원회(BEA)가 블랙박스 조사를 마친 상태이고, 에티오피아 사고 수사대에 자료를 넘겨준 상황입니다. 당시 항공기는 Addis Ababa 에서 동쪽으로 21해리 떨어진 곳을 날고 있었고, 고도는 9000피트를 지나고 있었던 것으로 확인됩니다. 이는 당시 지표면 고도가 8000..