엔지니어로 훈련을 받았지만 데이터 마이닝에 더 관심이있는 것으로 나타났습니다. 지금은 현장을 더 조사하려고합니다. 특히, 나는 존재하는 다양한 소프트웨어 툴 범주와 각 카테고리에서 주목할만한 툴과 그 이유를 이해하고 싶습니다. (저는 "최고의"도구는 말하지 않았으며, 주목할만한 도구는 화염 전쟁을 시작하지 않을 것입니다.) 특히 오픈 소스 도구이고 자유롭게 사용할 수있는 도구를 기록해 두십시오. 나는 오픈 소스에만 관심이 있고 무료입니다.
엔지니어로 훈련을 받았지만 데이터 마이닝에 더 관심이있는 것으로 나타났습니다. 지금은 현장을 더 조사하려고합니다. 특히, 나는 존재하는 다양한 소프트웨어 툴 범주와 각 카테고리에서 주목할만한 툴과 그 이유를 이해하고 싶습니다. (저는 "최고의"도구는 말하지 않았으며, 주목할만한 도구는 화염 전쟁을 시작하지 않을 것입니다.) 특히 오픈 소스 도구이고 자유롭게 사용할 수있는 도구를 기록해 두십시오. 나는 오픈 소스에만 관심이 있고 무료입니다.
답변:
보세요
그리고 UCI 기계 학습 저장소 데이터 세트.
RapidMiner (Java) [오픈 소스]
Rexer Anlaytics 는 매년 툴킷 조사를 수행합니다. KDnuggets 는 의도와 산업별로 소프트웨어 설명을 제공합니다.
SSDM (SQL Server Data Mining) 은 오랫동안 업데이트되지 않았지만 대규모 관계형 데이터베이스 및 큐브를 마이닝하는 경우 여전히 경쟁이 치열합니다. 나는 가능한 한 많은 마이닝 도구에 대한 테스트를 통해 느리지 만 체계적으로 slogging하고 있으며 SQL Server의 Windows 인터페이스는 내가 지금까지 찾은 가장 생산적이고 안정적입니다 (특히 엔터프라이즈 데이터베이스와 관련하여 놀랍습니다. 연약한 인터페이스) 연령에도 불구하고. 최신 WPF (Windows Presentation Foundation) 인터페이스를 선호하지만 이것이 가장 좋은 방법입니다.
기본 마이닝 기술을 습득하려고 할 때 SQL Server 데이터 마이닝에 대한 Rickety Stairway to A Rickety Stairway 라는 제목 의 전체 아마추어 튜토리얼을 썼습니다 . 나의 경험이 없었음에도 불구하고 그것들은 여전히 "gotchas"를 미리 식별하는데 도움이됩니다.