데이터 사이언스
Google Dataproc 설정하기 (클러스터 생성하기)
메가구글
2023. 3. 20. 17:56
1. google cloud console에 접속한다.
처음 입장하면 90일동안 크레딧 300$가량을 무료 사용이 가능하다고 뜨는데 그건 절차에 따라 하면된다.
그 후에 밑에 사진처럼 뜨고 빨간색 화살표에 dataproc이라고 검색을 한다.
2. dataproc 검색 후
처음 dataproc을 검색했다면 api를 추가할 것이냐고 물어보는데 이는 추가해주면 된다.
대략 1~2분 걸린다.
그리고 create cluster를 눌런다. (클러스터를 생선한다는 뜻이다.)
누른 후에는
사용할려는 목적에 맞게 클러스터를 만들어주면 된다.
나는 Compute Engine 클러스터를 골랐다.
3. Compute Engine 클러스터를 만든 이후
아래와 같은 화면이 뜬다.
클러스터 유형은 사용자의 목적에 맞게 설정하면 된다.
그리고 밑으로 내리면 라이브러리가 있는데
쓸려는 구성요소를 체크하면 된다.
밑에 체크한거는 글쓴이가 사용할 것을 임의로 체크한것이다. 사용자에 맞게 알맞게 체크하자.
(만약 image 2.0이상에서는 Anaconda를 뺴줘야 한다고 메세지가 뜨면 체크를 풀어주자)
그리고 개인적 셋팅을 다했다면 만들기를 눌러주자 .
4. 클러스터를 만든 이후
아래와 같이 나온다.
그리고 두번째 사진처럼 실행 중 체크표시가 뜬다면 실행완료가 된 것이다.