연중 로또 판매량의 비밀불경기와 자영업자들 폐업률이 치솟은 시장상황에 요즘 동행복권 로또복권에 관심 가지고 계신 분들이 많은 것 같습니다.로또 1등에 당첨되려면 814만분의 1의 확률을 뚫어야 하는데요.(실제로는 보통 5,000원씩 로또번호를 5개 구매하므로 162만 분의 1입니다)로또당첨번호를 예측하는 것은 독립사건 이기에 의미가 없지만, 일 년 중 언제 잘 팔리는지는 통계적으로 확인이 가능합니다.로또는 과연 일년 중 언제 가장 잘 팔릴까요? 동행복권 로또복권 판매금액은 해가 지남에 따라 계속 증가해 왔다아래 그래프는 2014년 9월부터 2024년 9월까지 로또복권 총상금을 나타내주는데요. (출처: 동행복권)2004년 개당 2,000원이던 로또는 1,000원으로 가격정책을 바꾼 이후 지난 20년간 가격..
-
동행복권 로또복권은 일년 중 언제 가장 잘 팔릴까?
연중 로또 판매량의 비밀불경기와 자영업자들 폐업률이 치솟은 시장상황에 요즘 동행복권 로또복권에 관심 가지고 계신 분들이 많은 것 같습니다.로또 1등에 당첨되려면 814만분의 1의 확률을 뚫어야 하는데요.(실제로는 보통 5,000원씩 로또번호를 5개 구매하므로 162만 분의 1입니다)로또당첨번호를 예측하는 것은 독립사건 이기에 의미가 없지만, 일 년 중 언제 잘 팔리는지는 통계적으로 확인이 가능합니다.로또는 과연 일년 중 언제 가장 잘 팔릴까요? 동행복권 로또복권 판매금액은 해가 지남에 따라 계속 증가해 왔다아래 그래프는 2014년 9월부터 2024년 9월까지 로또복권 총상금을 나타내주는데요. (출처: 동행복권)2004년 개당 2,000원이던 로또는 1,000원으로 가격정책을 바꾼 이후 지난 20년간 가격..
-
Statistics for Data Science: ANOVA
1. ANOVA 란? ANOVA는 "분산 분석"을 의미합니다. ANOVA는 실험에서 여러 그룹 또는 처리의 평균을 비교하는 데 사용되는 통계적 방법입니다. ANOVA의 기본 아이디어는 여러 그룹의 평균 차이가 통계적으로 유의한지 또는 우연히 발생할 수 있는지 확인하는 것입니다. ANOVA는 두 개 이상의 그룹 평균 간에 차이가 있는지 테스트하는 데 사용할 수 있습니다. 예를 들어, 연구자가 새로운 교육적 개입이 전통적인 교육 방법보다 더 효과적인지 여부를 확인하려는 경우 참가자를 새로운 개입 또는 기존 교육 방법에 무작위로 할당한 다음 각 그룹의 평균 테스트 점수를 비교합니다. ANOVA는 그룹 간 평균 테스트 점수의 차이가 통계적으로 유의한지 여부를 결정하는 데 사용됩니다. ANOVA는 종속 변수에 대..
-
Statistics for data science: Statistics
1. 모집단과 표본의 차이 모집단은 연구에서 관심 있는 모든 요소 또는 단위의 완전한 집합입니다. 우리가 배우고자 하는 개인, 사물, 사건 또는 측정의 전체 그룹입니다. 예를 들어, 인구는 특정 국가에 거주하는 모든 사람, 특정 회사에서 제조한 모든 제품 또는 특정 기간 동안 발생한 모든 판매가 될 수 있습니다. 반면에 표본은 분석을 위해 선택된 모집단의 더 작은 하위 집합입니다. 표본은 샘플에서 수집된 데이터를 기반으로 모집단에 대한 추론을 만드는 데 사용됩니다. 전체 모집단에서 데이터를 수집하는 것이 종종 실현 가능하지 않거나 실용적이지 않기 때문에 샘플링이 사용됩니다. 모집단과 표본의 구분은 중요합니다. 왜냐하면 표본 데이터에서 만들어진 추론은 표본이 추출된 모집단에만 적용되어야 하고 다른 모집단에..
-
Hierarchical clustering vs K-means
정리하자면 K-means 알고리즘과 Hierarchical clustering은 다음과 같은 면에서 차이점이 있다. 1. Approach method: Hierarchical clustering는 기존 군집을 재귀적으로 병합하거나 분할하여 군집 계층을 구축하는 반면, k-means은 각 데이터 포인트를 가장 가까운 군집 중심에 반복적으로 할당하여 데이터를 k 군집으로 분할합니다. 2. Number of clusters: Hierarchical clustering에서 클러스터 수는 미리 지정되지 않고 덴드로그램 또는 미리 지정된 중지 기준에 따라 결정됩니다. k-means에서 클러스터 수(k)는 사용자가 지정합니다. 3. Distance metric: Hierarchical clustering은 일반적으로..
-
머신러닝 기초 - 편미분(Partial Derivative) 이란?
Partial Derivative 는 주로 여러 변수가 있는 함수를 대항으로 미분할 때 사용된다. 예를 들어, 위와 같은 표면이 있다고 할 때, 1. x 에 대해서 기울기를 구할 수 있고(y는 고정된 상태) 2. y에 대해서 기울기를 구할 수도 있다(x는 고정된 상태) 위의 그림을 함수로 표현해 보면 다음과 같다. f(x, y) = x^2 + y^3 x에 대해서 기울기를 구하면 power rule 에 의해 f'(x) = 2x가 된다. 이 경우에서, y^3는 상수로 취급된다 y에 대해서 기울기를 구하면 power rule에 의해 f'(y) = 3y^2가 된다. 이 경우에서 x^2는 상수로 취급된다 실생활의 예제에서는, 실린더의 voume를 구하는데에 사용될 수 있다. 위와 같은 실린더에서, 실린더는 다양한..