분류 전체보기
-
How does AI calculate the percentage in binary language system?Data Science 2022. 11. 13. 21:16
How does AI calculate the percentage in binary language system? 웨비나 도중 다른 패널로부터 이러한 질문을 받았다. 그냥 간단히 By using very complex statistical model 이라고 대답했는데, 답변이 충분하지 않았던 것같다. Data Science에 대해 잘 모르는 사람에게 이것에 대해 가장 이해가 쉽고 직관적인 답변을 생각해봤다. 고안해낸 답변은 다음과 같다. 1. 매우 큰 Dataset을 적절한 비율로 쪼갠다(일반적으로 Data Scince에서는 7:3비율로 나눈다) 2. 70%의 데이터셋을 훈련시키고, 나머지 30%데이터셋을 통해 테스트를 한다. 여기서 Output(결과값)은 0또는 1이다 3. 훈련시킨 모델과 실제 Dat..
-
Computer Vision: 객체 트래킹Data Science 2022. 11. 13. 18:24
객체 트래킹 vs 객체 감지 Object Tracking Object detection Shorter time since it's reusing the data (object detection is already completed) longer time to detect since it has to be executed from scratch, frame by frame without reusing data Can be difficult if the object change poses drastically since it only detects an object at the first frame) In every frame, it detects the object again 객체 트래킹 두 가지 알고리즘..
-
Objects & AlgorithmsComputer Science 2022. 10. 21. 20:08
Let's say we have a class such as: class student: def __init__(self): self.firstname = 'David' self.lastname = 'Joyner' DJ = student() in this code, we can say DJ is an instance, student is object object is a general class that cannot be specified, and DJ is an instance that can be specified. for the other example, we can say 'person' is object, 'David Joyner' is instance that exists only one in..
-
Machine Learning with Python - ClusteringData Science 2022. 10. 7. 20:27
What is clustering? A group of objects that are similar to other objects in the cluster, and dissimilar to data points in other clusters. Then what is the difference between classification and clustering? The main difference is classification is used for labeled data, whereas clustering is used for non-labeled data(비지도 학습에 주로 사용) Where is clustering used? How can we determine the similarity or d..
-
dataframe 에서 any() 와 any(1)의 차이점Computer Science 2022. 9. 26. 23:45
다음과 같은 데이터프레임을 생성한다고 해 보자. # let's say we have a dataframe such as: import pandas as pd import numpy as np df = pd.DataFrame({'A':[0,1,2], 'B':[1,2,3], 'C':[2,3,4]}) column = ['C'] df.loc[1,'B'] = np.nan df[column] = np.nan df 출력하면 아래와 같이 나온다. ABC 001.0NaN 11NaNNaN 223.0NaN 여기서 A와 B칼럼에 대해서 결측치(NaN)값만 추출해 보자 sols = ['A','B'] df[sols].isnull().any() any()로 할 경우 any(0)와 같기 때문에 칼럼 기준으로 결측치 여부를 판별한다 ..
-
MarketTimer_1.0: making noteService developing 2022. 9. 8. 13:49
Service link(텔레그램 채널): https://t.me/MarketTimer_alarm_bot Intro 주식 퀀트투자 플랫폼 '젠포트' 단톡방에서 수요조사를 한 결과 실시간 코스닥 마켓타이밍 알람이 있었으면 좋겠다고 생각해서 개발하게 되었다. 사용한 주요 라이브러리는 FinanceDataReader, telegram, schedule, time, datetime 등이 있다. Service 현재 제공하고 있는 기본기능으로는 코스닥 현재가와 3,5,10 이동평균선을 비교하여 현재가가 3,5,10 이동평균 중 하나라도 높으면 매수타이밍, 현재가가 3,5,10 이동평균 전부보다 낮다면 매도타이밍 알람을 보내준다. 알람 시각은 10시, 12시, 14시(KST한국시각)이다. 서비스 예: 완성 코드: #!..
-
Machine Learning with Python - Classification(작성중)Data Science 2022. 8. 20. 23:01
- What is classification? A supervised approach, categorizing some unknown items into a discrete set of categories of classes - Normally, unlabeled test case 에는 defualt 값을 지정해 0또는 1로 표시한다. -> binary classifier Category가 여럿인 multi-class classification 도 있다 - Classification 의 종류 - K-Nearest Neighbor classification(KNN algorithm) 이란? 인접한 변수끼리 묶어 주는 것 - K-nearest neighbors algorism process 1. Pick a..
-
Machine Learning with Python - Regression(Simple, Multiple, Non-linear regression)Data Science 2022. 8. 19. 11:03
Regression: a process of predicting a continuous value Types of regression models: Simple Regression / Multiple Regression Simple Linear Regression: one independent variable(x)을 갖고 하나의 dependent variable(y)을 도출해 내는 것 Multiple Linear Regression: 여러개의 Independent variable 을 갖고 하나의 dependent variable 을 도출해 내는 것 Simple Linear Regression 공식. 세타1은 coefficient 라고 불리고, 쎄타0는 Intercept라고 불린다 How to find t..