목록전체 글 (303)
군침이 싹 도는 코딩
import mysql.connector def get_connection() : connection = mysql.connector.connect( host = '호스트이름', database = 'DB이름', user = 'USER명', password = '비밀번호', ) return connection try : # 데이터 insert # 1. DB에 연결 connection = get_connection() # 2. 쿼리문 만들기 query = '''insert into mysql_table (col1, col2, ...) values (value1, value2, ...);''' # 3. 커서를 가져온다. cursor = connection.cursor() # 4. 쿼리문을 커서를 이용해서 실..
$conda create -n 가상환경이름 python=3.8 openssl numpy scipy matplotlib ipython scikit-learn pandas pillow jupyter seaborn # 먼저 플라스크를 사용하기 위한 가상환경을 세팅해준다 # conda activate 가상환경이름 타이핑해서 만든 가상환경으로 이동 후 플라스크를 설치한다 pip install flask pip install flask-restful # 플라스크와 플라스크레스풀 라이브러리의 설치 명령어
REST(Representational State Transfer) 란 서버나 서비스에 존재하는 모든 자원(이미지, 동영상, DB자원)에 고유한 URI를 부여해 활용하는 것 통신을 위한 REST 구성 자원(Resource) : http://service.com/users 라는 형태의 URI 행위(Method) : GET/POST/DELETE/PUT과 같은 메소드 표현(Message) : JSON, XML 등의 형태를 이용해 표현 URI (URL) 구성 명칭 HTTP Methods Message Format Message 를 주고 받기위한 JSON 문법 Response 로 받아올때 HTTP Status Codes
chicago_df_1 = pd.read_csv('Chicago_Crimes_2005_to_2007.csv') >>> ParserError: Error tokenizing data. C error: Expected 23 fields in line 533719, saw 24 # 데이터 프레임을 불러올 때 이러한 에러가 나는 이유는 데이터 프레임 안에 일부 행 데이터가 잘못되어 있어서 발생하는 에러이다 chicago_df_1 = pd.read_csv('Chicago_Crimes_2005_to_2007.csv', error_bad_lines=False) # 디버깅하는 방법은 파라미터에 error_bad_lines=False 를 써주면 된다 이렇게하면 에러가 난 행 부분은 제외하고 가져오게 된다
chicago_df.index = chicago_df['Date'] chicago_df.head(2) # Time Series 데이터를 처리할때 그룹바이 함수로는 날짜데이터를 바로 년 단위 월 단위 등으로 묶어서 처리가 불가능하다 따라서 이것을 처리해주는 함수 resample을 써야하는데 이것을 사용하기 위해서는 우선 인덱스를 Date 컬럼으로 만들어 줘야한다 df_year = chicago_df.resample('YS').size() plt.plot(df_year) plt.show() # 리샘플을 사용해서 년의 시작점을 기준으로 묶어 차트를 그려보았다 # 리샘플에 들어가는 파라미터는 이 사진을 참고한다
similar_movies_list = pd.DataFrame() for i in range( myRatings.shape[0] ) : movie_title = myRatings['Movie Name'][i] recom_movies = corr_movie[movie_title].dropna().sort_values(ascending=False).to_frame() recom_movies.columns = ['correlation'] recom_movies['weight'] = recom_movies['correlation'] * myRatings['Ratings'][i] similar_movies_list = similar_movies_list.append( recom_movies ) # 추천 영화 작업..
corr_titanic = df.corrwith( df['Titanic (1997)'] ).to_frame() # Item based collaborative filltering 을 하기 위해서는 먼저 상관관계를 분석해야 한다 먼저 분석하고싶은 영화의 컬럼을 넣어 corrwith로 전체 컬럼과 상관관계를 분석한다 그다음 그것을 데이터 프레임으로 만들어준다 corr_titanic.columns = ['correlation'] # 컬럼의 이름을 correlation으로 고쳐주도록 한다 corr_titanic = corr_titanic.join(ratings_mean_count_df['count']) # 조인함수를 통해 영화 별점의 갯수를 가진 테이블과 붙여준다 corr_titanic.dropna(inplac..