Apache Hadoop에 해당하는 .NET이 있습니까? [닫은]


98

그래서 저는 예리한 관심을 가지고 Hadoop 을 살펴 보았습니다. 솔직히 말해서 매료되었습니다.

내 유일한 사소한 문제는 C # 개발자이고 Java에 있다는 것입니다.

Hadoop.net 또는 NHadoop 또는 Google MapReduce 접근 방식 을 포용하는 .NET 프로젝트를 찾는 것만 큼 Java를 이해하지 못하는 것은 아닙니다 . 아는 사람 있나요?

답변:


57

Hadoop의 스트리밍 을 사용해 보셨습니까 ?

나는 항상 파이썬에서 그것을 사용합니다 :-).

이기종 접근 방식이 종종 최고이고 다른 사람들도 똑같이하는 것처럼 보입니다.

프로토콜 버퍼 나 페이스 북의 절약과 같은 프로젝트를 살펴보면 때로는 다른 언어로 작성된 앱을 사용하고 선호하는 언어로 접착제를 만드는 것이 최선이라는 것을 알 수 있습니다.


2
이것은 C #에서 Hadoop을 사용하는 기술이 아니며 스트리밍이 프로세스를 분리하고 데이터가 문자열로 전달되므로 효율적이지 않습니다.
Felice Pollano 2016 년

13

7
Microsoft는 드라이어드를 취소하고 하둡을 고수하기로 결정
아르 논 로템 - 갈 - 오즈에게

@ ArnonRotem-Gal-Oz : Microsoft의 해당 진술에 대한 참조가 있습니까?
Abel

4
blogs.technet.com/b/windowshpc/archive/2011/11/11/…을 참조하십시오 .- "이 릴리스의 일부로 LINQ to HPC의 미리보기 버전도 업데이트했습니다. 그러나 이것은 최종 미리보기가 될 것입니다. 프로덕션 릴리스로 진행할 계획은 없습니다. 10 월 PASS 컨퍼런스에서 발표 된 내용에 따라 Apache Hadoop을 Windows Server와 Windows Azure 모두에 적용하는 데 집중할 것입니다 ... "
Arnon Rotem-Gal-Oz

13

최근 MySpace는 .NET MapReduce 프레임 워크 인 Qizmt 를 오픈 소스로 출시 했기 때문에이 분야에서도 잠재적 인 경쟁자입니다.


2
그들의 라이선스는 GPL입니다 (좋은 것 그들이 뭔가가 덜 제한 선택한 경우 ...
IgorK

3
이 경우 GPL이 당신을 방해 할 가능성은 정말 적습니다. 조직 외부에서 소스 (있는 경우)에 수정 사항을 배포하지 않는 한 코드를 릴리스 할 필요가 없습니다.
foxxtrot 2011-08-15

비공개 소스 제품 (제품 회사)을 배포합니다. 그리고 우리가 GPL의 소프트웨어 구성 요소에 의존하려고한다면 우리는 자동으로 소스도 배포해야합니다. 폐쇄 소스 프로젝트에 라이브러리를 포함하는 것이 괜찮은 LGPL이 아닙니다 :(
IgorK

완전히 공정합니다. 저는 대부분의 사람들 이 Map-Reduce 프레임 워크를 사용하는 데 이러한 제한이 없을 것이라고 생각합니다 . 즉, 나는 이것을 GPL로 공개하는 MySpace의 비즈니스 사례를 이해하지 못합니다. 그들이 별도로 라이센스하지 않는다고 말할 수 있습니다.
foxxtrot

나도 이해가 안 돼! 누군가가 'MySpace 킬러'를 만들고 싶다면 (바이너리 나 소스를 재배포하지 않고) 사내에서 사용함으로써 만족할 것입니다. / : 나는 ... 슬픈 이상한 모든 소스 배포를 사용하여 공개 웹 서비스와 허점을 해결하는 것이 더 적절할 것 AGPL (Affero GPL)를 사용하지 같아요
IgorK

10

여기 내 질문에 귀하의 질문에 대답 했습니다.

여기 소스에서 말하려면 :

Microsoft 는 Hadoop을 위해 대안 ( Dryad )을 삭제 했습니다 . 내년에는 하둡 통합이 적용된 MS SQL Server 2012를 출시 할 예정입니다. Azure 및 Windows Sever 지원은 우리가 말하는 것처럼 개발되고 있습니다.

2012 년 상반기에 출시 될 예정입니다.

Hadoop은 # 1 BigData 플랫폼이며 Oracle이 채택하고있는 오픈 소스 및 독점 소스 (Java, .Net, Python 등)에서 지원 될 것입니다.

무언가를 개발 중이라면 .Net 플랫폼을 사용하고 있다면 기다려야합니다.

가능한 것에 대한 자세한 정보는 여기에서 확인할 수 있습니다.


5

DryadLinq는 우리 .NET 사람들이 Hadoop에 가장 가까운 것입니다. 그러나 그것은 당신이 hadoop을 사용하려는 것에 달려 있습니다. 최적화 된 자체 유지 관리 분산 파일 (DFS) 시스템을 찾고 있다면 DryadLINQ 찾고 가 것이 아닙니다. DFS와 유사하지만 수동으로 파티션을 빌드하고 각 파티션을 배포해야합니다.

즉, DryadLINQ보다 찾고있는 Hadoop의 분산 실행 측면이 정말 훌륭하다면 (아니요, 저는 MS와 관련이 없습니다). 언제 까지나 당신이 가지고있는 마이크로 소프트의 HPC 점점보다 클러스터 설정을 DryadLINQ로가는 것은 정말 쉽습니다.

작성하는 코드는 LINQ를 실행하는 대신 (자체 빌드 분산 데이터 구조) IEnumerable<T>실행해야 한다는 점을 제외하면 실제로는 단순한 LINQ 코드 PartitionedTable<T>입니다.

DryadLINQ의 정말 멋진 점은 알고리즘을 개발할 때 시간을 빠르게 처리 (시도, 테스트, 조정, 반복) 할 수 있다는 것입니다. LINQ 코드를 작성하여 계산을 수행하면 DryadLINQ가 전체 분산 실행 부분을 처리합니다. 단일 프로세스 처리를위한 코드를 작성하는 것처럼 분산 처리를위한 코드를 작성하는 것은 제가 본 것 중 가장 자연스러운 아날로그입니다.


4

RavenDb와 같은 것을 살펴볼 수 있으며 상당히 큰 크기의 데이터에 대해 MapReduce를 매우 적절하게 지원합니다. .Net에 내장되어 있으므로 적절한 LINQ 클라이언트 API를 사용할 수 있습니다.

http://ravendb.net/

시작하려면 내 블로그 entery를 읽을 수 있습니다 .



2

Microsoft는 "100 % Apache 호환 Hadoop 배포"로 청구되는 HDInsight를 배포하는 중입니다.

Windows Server와 Windows Azure 서비스 모두에서 사용할 수 있습니다.


1
HDInsight는 Hortonworks 배포판입니다. 다른 주요 공급 업체도 Microsoft와 협력하여 Azure에서 배포를 제공하고 있습니다. 질문과 관련하여 : HDInsight에 대한 .NET 인터페이스가 있지만 HDInsight 자체는 .NET이 아닙니다
ashtonium


1

이제 .NET에서 직접 Hadoop을 사용할 수 있습니다. Microsoft는이를 위해 SDK를 출시했습니다.

https://hadoopsdk.codeplex.com/

물론 이것은 자바 기반 하둡 네트워크를 사용하는 것을 의미합니다. 그러나 서버가 Java에서 실행 중인지 여부가 중요합니까? 나는 누군가가 그것을 포팅하려고 할 것이라고 확신하지만 기업이 이미 자바 버전을 지원하고 있고 .NET 포트가 같은 관심을 끌 것이라고 생각하지 않기 때문에 좋은 생각이 아닐 것입니다.



1

내부적으로 Microsoft는 Cosmos를 사용하고 있습니다. 이것은 Azure를 통해 Microsoft 외부에서 사용할 수 있습니다. 이름은 Azure Data Lake AnalyticsAzure Data Lake Store 입니다. Azure Data Lake 분석은 일종의 Yarn as a Service이고 Azure Data Lake Store WebHDFS는 서비스입니다. Azure Data Lake Analytics의 첫 번째 버전은 Transact-SQL + C # 기반 언어 인 U-SQL 만 호스팅합니다.



0

dryad / linq는 제품화 중이며 곧 출시 될 예정입니다. http://blogs.technet.com/b/windowshpc/archive/2011/07/07/announcing-linq-to-hpc-beta-2.aspx 함께 사용 비정형 데이터를 처리하기위한 강력한 클러스터 기반 솔루션을위한 Microsoft HPC


/ / 곧 출시 될 예정 이, 위의 답변을 볼 수 없습니다
OM-NOM-NOM

1
용의자 Dryad와 HDInsight는 서로 상충됩니다. Microsoft가 HDInsight 용 Dryad를 중단 할 것이라는 소식을 계속 들으십시오
Swab.Jat

0

다른 사람들이 언급했듯이 DryadLINQ 는 개발자가 MapReduce와 유사한 방식으로 LINQ 쿼리를 작성하고 클러스터에서 실행할 수 있도록하는 프로그래밍 프레임 워크입니다. DryadLINQ 프로젝트는 최근 GitHub 의 Apache 라이선스에 따라 릴리스되었으며 릴리스에는 YARN 클러스터 (Azure HDInsight 클러스터 포함)에서 실행하기위한 지원이 포함됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.