본문 바로가기

Sooin's Equipment/Probability & Statistics(확률과 통계)6

[확률&통계] 3. 자료 수집 (feat. 디자인 필드에서) 이전 글에서 디자인분야에서 확률과 통계의 필요성에 대해 이야기 하였다. 오늘은 어떻게 자료를 수집해야하는지 알아보자. 디자인분야에서 진행하는 분석단계 아래의 순서대로 진행된다. 1. 조사문제의 정의 2. 조사 설계(자료수집과 분석 계획) 3. 조사형태의 선택(설문, 인터뷰, 관찰, 문헌…) 4. 데이터 소스의 확인과 수집(기존 수집 or 직접 수집) 5. 표본 설계 및 표본 조사 6. 자료의 처리(분석 및 해석) 7. 분석 결과의 활용 기존의 자료를 수집하기 위해서는 정리된 문헌이나 논문, 책, 기사, 유튜브 등을 확인하면 된다. 그렇다면 어떻게 해야 직접수집이 가능할까? 1. 관찰법 : 일상생활 중에서 지식을 학습하는 방법 (주관적 관찰 내용을 객체화 시킬 수 있는 자료 수집방법) - 실험연구와 사례연.. 2024. 4. 18.
[확률&통계] 2. 통계학의 개념 (feat. 모르는데 어떻게 알아요!) 통계는 데이터가 기반이다!인공지능도 데이터가 없었다면 무용지물이었을 것이다. 나: “ChatGPT! 내 나이 맞춰봐” 인공지능: “누구신데 나이를 맞춰요?” 데이터(지식)가 없다면 마치 조세호처럼 되는거다.. (모르는데 어떻게 가요!) 데이터 = 수치의 모음: 162, 195, 157, 167.. 데이터를 분석을 하지 않는다면 아무 의미 없다! 데이터를 분석한다면?: 데이터의 성질을 파악하고 대상을 이해하고 미래도 예측할 수 있다. 빅데이터란?: 현재 정보기술이 발달하여 컴퓨터 등으로 다양한 데이터를 얻을 수 있고 대량의 데이터를 얻어 분석하는 빅데이터분야가 떠오르고 있다! 디자이너에게 데이터분석이란?: 디자인에서 직접 데이터를 수집하고 분석하며 사용자의 니즈를 파악하는 것이다! -> 데이터 분석을 통해.. 2024. 4. 18.
[확률&통계] 1. 예술 = 디자인(?) 예술이 디자인일까? 디자인이 예술일까? 서로 포함되어 있는 것일까? 내가 생각한 디자인은 예술과 엄연히 다르다. 왜 다르다고 생각했을까? 먼저 예술과 디자인은 모두 창의적인 사고가 필요하고 누군가에게 보여줄 수 있어야한다. (눈으로 보거나 소리 등으로 다른 사람이 알아차릴 수 있어야 한다.) 그렇다면 비슷한 것이 아닌가?예술과 디자인의 차이점은 뭘까? 예술은 사람들이 보고 생활속에서 정말 필요하다고 느껴지지 않을 수 있다. 다시 말하면 예술은 고객들의 니즈(필요성)에 대해 크게 신경을 쓰지 않아도 된다는 말이다. 반대로 디자인은 생활 속에서 사람들이 보고 필요하다고 느껴져야 한다! 고객들은 자신이 필요하다고 느껴지도록 신경을 써야 한다. 예를 들면,스마트폰이 그림작품보다 필요도가 더 높을 수 있다는 것이.. 2024. 4. 18.
[확률&통계] 회귀분석 회귀분석왜 사용할까?: 상관식을 분석하기 위해 회귀분석(regression analysis)란?: 변수들간의 함수적 과련성을 규명하기 위해 어떤 수학적 모형을 가정하고이 모형을 측정된 변수들의 자료로부터 추정하는 분석방법 회귀분석 = 직선의 방정식(2점의 방정식 y= ax + b)     회귀분석과 상관분석의 차이점상관분석은 두 변수간의 상관성에 대한 존재여부만 분석회귀분석은 독립변수의 변화에 의해 종속변수의 값을 예측할 수 있음 (e.g. 머신러닝)     회귀분석의 종류단순회귀분석: 하나의 설명변수만을 갖는 회귀분석 다중회귀분석(중회귀분석): 설명변수가 2개 이상의 회귀분석     회귀분석 활용1. 기업이 자사의 매출액을 예측하고자 할 때 매출액에 영향을 미칠 수 있는 변수를 자료를 통해 매출액을 예.. 2024. 4. 3.
[확률&통계] 상관분석 상관분석: 변수 간에 어떠한 상관성이 있는지 분석한다. 상관분석이 수행되는 두 변수는 모두 측정 변수이어야 한다.(두 변수가 등간척도 이상인 경우)*등간척도: 변수의 값을 순서대로 나열할 수 있고 간격이 일정한 변수를 지칭하는 것  "등간척도 이상이 있다면 이하도 있나??"등간척도보다 낮은 척도인 명목척도나 서열척도를 뜻한다. 명목척도와 서열척도는 관계를 분석할 때상관분석을 사용하지 못하고다른 통계적 기법이나 비모수적 방법을 사용해야한다.  e.g.디자인 모델 5개에 대한 선호도, 조작성, 심미성을100점 척도의 평가를 통해 상관관계가 존재하는지 알아보는 경우    산포도왜 산포도를 그릴까?: 두 변수 사이의 관계를 살펴보기 위해 표시 방법:1. 설명변수는 x로 표기하고 가로축에 표시2. 피설명변수는 y.. 2024. 4. 3.
[확률&통계] 분산분석 디자인을 평가할 때 분산분석이 활용된다.  위와 같이 여섯 개의 휴대폰 색상의 선호도에 차이를 알고 싶다.이 상황에서 통계적 유의성 검정이 필수적이다! 변동성이 있기에 분산분석을 하게 된다.분산분석으로 관심이 있는 요인에 영향(요인에 의한 변동성)과 관심 없는 요인에 영향(노이즈에 의한 변동성)을검증하고 뒷받침과 설득력이 될 수 있다.     가설과 유의 수준위를 검증하기 위해 가설과 유의 수준을 먼저 알아본다. 1. 가설 (귀무가설 H0 vs 대립가설 H1 == 기존의 가설 vs 새롭게 주장하는 가설) : 현상에 대한 예상, 주장 또는 단순한 추측 등 - 귀무가설 H0 : 모집단의 특성에 차이가 없다고 하는 가설(특정한 요인이 없으면 같다) - 대립가설 H1 : 모집단의 특성에 차이가 있다고 하는 가설.. 2024. 4. 3.