목록전체 글 (20)
Study for me
다항 회귀가설함수의 그래프는 직선이지만, 우측 그래프처럼 곡선 그래프로 나타내는 걸 다항 회귀, 영어로는 Polynomial Regression이라고 한다.단일 속성 다항 회귀 : 속성이 하나인 다항 회귀 ex) 집 크기를 이용해서 집 가격을 예측하는 경우 만약 가설 함수가 이차 함수인 다항 회귀를 한다면, h θ (x)=θ 0 +θ 1 x+θ 2 x 2 에서 학습 데이터에 가장 잘 맞는 θ 0 , θ 1 , θ 2 를 찾으면 되고 만약 가설 함수가 삼차 함수인 다항 회귀를 한다면, h θ (x)=θ 0 +θ 1 x+θ 2 x 2 +θ 3 x 3 에서 학습 데이터에 가장 잘 맞는 θ 0 , θ 1 , θ 2 , θ 3 를 찾으면 된다.해당 표에서는..
데이터 분석과 시각화시각화와 그래프%matplotlib inlineimport pandas as pddf = pd.read_csv('data/gdp.csv', index_col=0)df.plot(y=["Korea_Rep", "United_States", "United_Kingdom", "Germany", "China", "Japan"])선 그래프를 그리기 위해서는 %matplotlib inline을 위에 써주고, df.plot()이라는 함수를 사용하면 된다.%matplotlib inlineimport pandas as pddf = pd.read_csv('data/silicon_valley_summary.csv')# 여기에 코드를 작성하세요mdf = df['job_category'] == 'Managers..
DataFrame 인덱싱위 같은 데이터 테이블이 있다고 가정할때, 아이폰 8의 메모리를 불러오려면 어떻게 해야 할까?(iphone_df라는 데이터프레임이 있다고 가정)iphone_df.loc['iPhone 8', '메모리']위 같은 코드로 불러올 수 있다.그렇다면 column의 특정한 영역이 아니라, 아이폰 8의 모든 정보를 불러오고 싶다면 어떻게 해야 할까?iphone_df.loc['iPhone 8', :]: 기호를 사용해서 모든 정보를 불러올 수 있다. (혹은 : 기호는 생략 가능하다)반대로 아이폰 8의 메모리가 아니라 모든 핸드폰의 메모리를 불러오려면 어떻게 해야 할까? 즉, column에 있는 모든 정보를 불러오고 싶을때이다.iphone_df.loc[:, '출시일'] # or iphone_df.l..
데이터 사이언스란?크게 3가지 정의로 나눌 수 있다.1. 데이터 과학이란, 다양한 데이터로부터 지식과 인사이트를 추출하는 분야다.2. 데이터 사이언스는 데이터와 연관된 모든 것을 의미한다.3. 데이터 사이언티스트란 프로그래밍, 수학과 통계, 특정 분야에 대한 전문성을 가진 사람이다.결론적으로 데이터 사이언티스가 하는 일은 가치를 더할 수 있는 일이 무엇인지 찾아내고, 데이터를 통해서 그 일을 해결하는 것이다.데이터 사이언스의 단계1. 문제 정의하기2. 데이터 모으기3. 데이터 다듬기4. 데이터 분석하기5. 데이터 시각화 및 커뮤니케이션Numpynumpy란 numerical python의 줄임말이다. 숫자와 관련된 파이썬 라이브러리다.numpy에서 제공되는 array가 따로 있는데, 파이썬에서 기본 제공되..
요즘 폴리테루라는 브랜드의 옷이 굉장히 핫하다. 구하고 싶어도 거의 5초 안에 품절되는 모습과 번개장터에 웃돈 얹어서 파는 모습을 보고 좀 억울하기도 해서, 파이썬 연습할 겸 매크로를 한 번 만들어보기로 했다. Selenium을 사용할 예정이다. 방법 우선 매크로를 실제로 돌려보면서 구매가 되는지 확인을 해봐야 하는데, 대부분의 품목이 품절이라 쉽지 않았다. 겨우겨우 품절되지 않은 몇 개의 품목을 찾아서 로직을 세워보기로 했다. 기본적으로 폴리테루는 특정시간에 드랍하는 방식을 사용하므로 드랍 시간에 제품 상세페이지에 접속해서 구매하기 버튼이 뜰 때까지 새로고침 하는 방식으로 구현했다. 요약하면 다음과 같다. 폴리테루 스토어 로그인 => 상품 상세페이지 접속 => 사이즈 선택 => 구매하기 버튼 클릭 =>..
전역이 약 3개월 남은 이 시점, 나는 포상휴가를 받기 위해서 안 하던 짓을 해버렸다. 테셋과 매경시험이 쉽다는 주변 선후임 동기들 말만 믿고 덜컥 신청해 버린 것이다. 시험 보기 전 나는 경제에 ㄱ자도 모르는 문외한이었다. 자랑은 아니지만 금리가 오른다는 뉴스를 보면서 "금리가 뭐지?" 이런 생각할 정도였으니.. 오늘은 비전공자 공돌이의 TESAT과 매경 TEST 합격 후기에 대해 적어보도록 하겠다. 다만 만점후기가 아닌 1급과 우수후기라는 걸 감안하고 봐주시면 감사하겠다. 매경 TEST 총점 670, 우수등급으로 무난하게 패스했다. 명목상 시험 준비 기간은 3주였지만 실제 순공시간으로 따지면 2주 정도 된다. 매일 하루 1시간 반~2시간 정도 공부했다. 아무래도 노베이스다 보니 어디서부터 시작할지 굉..
개요 작년 11월쯤 입대하기 전에 훈련소에서 뉴스레터를 받을 수 있도록 프로그램을 만들고 들어갔었는데 흥미로웠던 프로젝트였다. 훈련 끝나고 매일 저녁에 뉴스 받는 게 재밌기도 했고, 시간 안 갈 때마다 어제 받은 인편 곱씹으면서 보는 게 쏠쏠했다. 훈련소도 수료하고, 자대도 배치받으니까 든 생각이 뭔가 이 프로젝트 나만 쓰기 좀 아쉽다.라는 생각이었다. 주변 친구들한테 이런 아이디어 물어보니까 다들 괜찮다고 하기도 했고, 마침 토이 프로젝트도 하나 만들고 싶어서 사지방에서 개발을 시작하게 되었다. 보라매인편..? 보라매인편 borameletter.com 보라매인 편은 공군 훈련병들에게 무료로 인터넷 편지를 보내주는 서비스다. 단순 뉴스만 보내주는 것이 아닌, 스포츠 뉴스나 주식 가격, 비트코인 가격이나 ..
자료구조와 알고리즘 강의 정리 자료구조와 알고리즘 성능 자료구조와 알고리즘은 보통 코드(C, Java, Python 기타 등등...)들로 구현되는데, 이 코드를 실행하는 컴퓨터가 제각각 상이하다는 문제가 있다(하드웨어뿐만 아니라 소프트웨어 포함). 즉, 똑같은 알고리즘을 똑같은 언어로 구현을 하더라도 소프트웨어와 하드웨어 따라 서로 다른 성능을 보여준다는 문제점이 있다. 또한, 굉장히 다양한 크기의 입력이 존재한다는 것이다. 어떤 알고리즘은 어떤 입력에 대해서는 굉장히 빠르게 동작하고, 어떤 입력에 대해서는 굉장히 느리게 동작할 수 도 있다. 그리고 입력의 크기가 커질수록 시간도 많이 걸린다. 여기서 현실적인 문제점이 발생한다. 여러 가지 종류와 다양한 크기의 입력에 대해서 내가 작성한 코드가 얼마나 빨..