목록Python (138)
군침이 싹 도는 코딩
# 각 함수별로 보여주는 출력방식을 정리해보았다 st.help() 함수는 파이썬의 함수들의 설명을 출력해주는 함수이다
# 우측 하단에 인터프리터를 눌러서 자신의 가상환경에 맞는곳으로 설정해준다 # Command Prompt 를 눌러준다. # streamlit run 실행시킬 파일의 이름을 적어준다 # 정상적으로 실행이 됐다면 이런 인터넷창이 열린다 이제 종료하고 싶다면 터미널을 클릭하고 ctrl + c 해주면 된다
# 스트림릿 라이브러리를 사용하기 위한 임포트문 작성 import streamlit as st # 웹 대시보드 프레임워크인, 스트림릿은 # main 함수가 있어야 한다. def main() : st.title('헬로우') st.title('개발 프로젝트') if __name__ == '__main__' : print(__name__) main() # 비주얼 스튜디오 코드를 실행해서 스트림릿 라이브러리를 사용하기 위해 임포트문을 작성한다 그 후 기본적으로 def main 을 작성해준다.
구글에 streamlit 이라고 치면 사이트가 나오는데 해당 사이트 try steamlit now 를 누르면 해당 페이지로 이동된다 그 후 pip install streamlit 을 누르면 복사가 되는데 이것을 아나콘다 프롬프트에 붙여넣기 후 실행하면 된다.
깃은 소스코드 버전관리 시스템으로 다수의 사람이 개발할때 버전관리를 편하게 하기위해서 사용한다. 이를 편하게 사용할수 있는 사이트가 github.com 이다 # 깃허브를 사용하기 위해 꼭 알아둬야하는 개념이 있다 commit : 파일을 추가하거나 변경 내용을 저장소에 저장하는 작업 push : 파일을 추가하거나 변경 내용을 원격 저장소에 업로드하는 작업 로컬 저장소와 원격 저장소 저장소는 자신의 컴퓨터에 있는 '로컬 저장소'와 서버 등 네트워크에 있는 '원격 저장소' 2가지가 있다. 기본적으로 로컬 저장소에서 작업을 하고 그 결과를 원격 저장소에 저장하게 된다. 1. 먼저 github 사이트에 가입하고 프로젝트 저장소 ( repository ) 를 만든다. 깃허브 메인화면에서 create New Repo..
계층적 군집 ( Hierarchical clustering ) 은 K-means 와 마찬가지로 unsupervised 에 사용되는 머신러닝 기법이다 따라서 y값이 존재하지않아 따로 검증하지않는다 이 데이터 프레임으로 계층적 군집을 만들어보겠다 1. X 값을 지정해준다 X = df.loc[:,'Annual Income (k$)':] X 2. 최적의 클러스터 갯수를 찾기 import scipy.cluster.hierarchy as sch sch.dendrogram( sch.linkage(X,method='ward')) plt.title('Dendrogram') plt.xlabel('Customers') plt.ylabel('Euclidean Distances') plt.show() # 세로선이 길어질수록 먼..
동작원리는 먼저 그룹을 몇개로 나눈다음 각 그룹의 중심점을 랜덤으로 잡고 그 중심점을 기준으로 선을 그어 영역을 나눈다 그 영역안을 자신의 색깔로 바꾸고 그 영역안의 중심점을 또 찾아 중심점이 이동한다 이러한 방식을 무한반복하는것이다. 주로 그루핑을 할때 사용한다 이 데이터프레임으로 K-means를 해보겠다 1. nan 을 확인 df.isna().sum() >>> CustomerID 0 Genre 0 Age 0 Annual Income (k$) 0 Spending Score (1-100) 0 dtype: int64 2. X,y 값을 세팅 X = df.iloc[:,3:] X # X의 값만 세팅한 이유는 언수퍼바이즈드 러닝에서는 y값이 없기때문이다 따라서 분류나 수치예측이 아니기때문에 피쳐 스케일링도 필요없..
Decision Tree 의 알고리즘은 이러하다 어떤 결과값을 가지고 계속해서 이분화하는것이다 이 데이터 프레임으로 구매를 예측하는 디시전 트리를 만들어보겠다 1. nan 을 확인 df.isna().sum() >>> User ID 0 Gender 0 Age 0 EstimatedSalary 0 Purchased 0 dtype: int64 2. X,y 를 나눈다 y = df['Purchased'] X = df.loc[:,'Age':'EstimatedSalary'] 3. 피쳐 스케일링 해준다 from sklearn.preprocessing import MinMaxScaler scaler_X = MinMaxScaler() X = scaler_X.fit_transform(X.values) # y는 이미 0과 1이..