이번 학기 에는 머신 러닝 과정이 있으며 교수는 실제 문제 를 찾아 수업에 도입 된 머신 러닝 방법 중 하나를 통해 해결 하도록 요청 했습니다.
나는 stackoverflow 및 stackexchange 의 팬 중 하나이며 이러한 웹 사이트의 데이터베이스 덤프 는 훌륭하기 때문에 대중에게 제공된다는 것을 알고 있습니다 ! 이 데이터베이스에 대해 좋은 기계 학습 과제를 찾아서 해결할 수 있기를 바랍니다.
내 생각
질문 본문에 입력 된 단어를 기반으로 질문에 대한 태그를 예측한다는 생각이 떠 올랐습니다. 베이지안 네트워크는 질문에 대한 태그를 학습하기위한 올바른 도구이지만 더 많은 연구가 필요하다고 생각합니다. 어쨌든, 사용자가 질문 입력을 마치면 학습 단계 후에 일부 태그를 제안해야합니다.
알려주세요 :
ML 커뮤니티에 대한 경험이 풍부한 사람들로서 통계 커뮤니티에 다음 두 가지 질문을하고 싶습니다.
태그 제안이 적어도 해결할 수있는 문제라고 생각하십니까? 그것에 대해 조언이 있습니까? stackexchange가 아직 그러한 기능을 구현하지 않기 때문에 조금 걱정입니다.
stackexchange 데이터베이스를 기반으로하는 ML 프로젝트에 대한 다른 아이디어가 있습니까? stackexchange 데이터베이스에서 배울 내용을 찾기가 정말 어렵습니다 .
데이터베이스 오류에 대한 고려 사항 : 데이터베이스가 크고 인스턴스가 많지만 완벽하지 않고 오류가 발생하기 쉽다는 점을 지적하고 싶습니다. 확실한 것은 신뢰할 수없는 사용자의 나이입니다. 질문에 선택된 태그조차도 100 % 정확하지 않습니다. 어쨌든 문제를 선택할 때 데이터 정확성의 백분율을 고려해야합니다.
문제 자체에 대한 고려 사항 : 내 프로젝트는 이와 관련해서는 안됩니다 data-mining
. 실제 환경에서 ML 분석법을 적용해야합니다.