Perl이 생물 정보학에서 왜 그렇게 많이 사용됩니까? [닫은]


14

생물 정보학에 유용한 Perl은 무엇입니까? C ++, Matlab 또는 Python이 왜 큰 언어가 아닌가?

답변:


13

생물 정보학에 Perl을 유용하게 만드는 이유는 1) 비교적 배우기 쉬운 언어, 2) bioPerl을 포함한 기존 스크립트가 많이 있으며 3) 수백 개의 스크립트와 모듈이있는 실험실이 될 가능성이 있다는 것입니다. 이미 Perl로 작성되었습니다.

프로그래머의 수준은 언어의 선택과 관련이 없으며 그 다음에 요구되는 작업입니다. 고급 또는 계산 비용이 많이 드는 작업은 일반적으로 Java 또는 C로 작성되며 클러스터에서 실행됩니다.

생물 정보학에 대해 이해해야 할 한 가지는 다양한 분야이며, 그것을 수행하는 사람들에게 다양한 과제가 제기된다는 것입니다. 하루에 Perl, R 및 Java를 사용하는 것은 드문 일이 아닙니다. 스크립트 스크립팅, 파일 이동, 다운로드, 기본 데이터 분석 등, 데이터 시각화를위한 R, 알고리즘 계산 ​​/ 응용 프로그램 작업 및 수정을위한 Java를위한 Perl. 즉, 내가하는 대부분의 작업은 Perl을 사용해야하지만 루비로 전환하고 싶습니다. 루비에는 고급 기능, 람다 및 프로세서가있어보다 간결한 코드로 이어질 수 있으며 완전히 객체 지향적입니다.


1
천만에요. 더 궁금한 점이 있거나 현장에 들어갈 생각이라면 여기 도움이 될만한 다른 답변이 있습니다.
wespiserA


24

Perl의 고유 한 미덕을 제외하면 이것의 일부는 단순히 역사입니다. 인간 게놈 프로젝트로 인해 세기 초에 생물 정보학이 크게 확장되었습니다. 당시 Perl은 지금까지 가장 널리 사용되는 스크립트 언어 였습니다 . 루비와 파이썬은 확실히 있었지만 오늘날 그들이하는 지원 / 마인드 쉐어는 거의 없었습니다. 이것은 Perl에게 많은 운동량을 주었다.

생물 정보학에서 Perl의 사용이 감소하고 있으며 R의 인기가 급격히 증가하고 있다고 생각합니다. 그러나 이름을 지정하려는 모든 언어에 대해 해당 정보를 사용하는 생물 정보학 실험실을 찾을 수 있습니다.


2
동의했다. 나는 펄스 박사가 90 년대 중반에 "Perl이 어떻게 인간 게놈 프로젝트를 구해 냈는가"라는 제목을 가진 기사 나 그와 비슷한 것을 믿는 기사를 기억합니다. 나는 약 10 년 동안 생물 정보학 분야에서 일해 왔지만 실제로 Perl을 사용하는 사람을 만나지 못했습니다. Matlab & Python의 양이 적을 때 주로 R이었습니다.
geoffjentry

6
R이 Perl을 대체하는 것은 아닙니다. R은 탐색 적 데이터의 데이터 분석 / 시각화에 사용됩니다. 일반적인 스크립팅 작업은 여전히 ​​perl로 수행됩니다.
wespiserA

+1 : 또한 일본인은 여전히 ​​파이썬이나 루비보다 펄을 많이 사용하는 것 같습니다 (일본인과 채팅을하는 일본인의 경우). 바이오 인포 매틱스와 같이 일본 연구와 관련된 기술에 큰 영향을 미칠 수 있습니다. 그들은 미국의 지도자입니까?
Klaim

@geoffjentry : 나는 Perl에서 꽤 많은 처리를 보았지만, 현장에서 10 년은 없었습니다 (2 년 전부터 몇 년 전 몇 가지 짧은 경험과 함께). 그러나 R은 수학적 계산이 예상되고 (대규모 데이터 세트에 대한 통계 분석이 고려 될 때) 훌륭한 시각화를 생성 할 때 가장 중요합니다 (실제로 많은 솔루션이 자체 롤아웃하는 대신 R 엔진과 간단히 통합하는 것을 선호합니다).
haylem

내가 진술을 암송해야한다고 쓴지 8 개월 만에 펄이 사용되는 것을 보았습니다. :) 이 경우에도 여전히 오래된 특성이나 펄을 사용하여 치아를 자르고 막힌 사람과 같은 역사적인 성격으로 보입니다. 나의 새로운 직장에서 계산 생물 학자들의 대부분은 파이썬과 r의 혼합 (파이썬과 r의 혼합)을 사용합니다.
geoffjentry

10

나는 그들 중 많은 사람들이 요점을 놓쳤다 고 생각하면서 여기에 대답을 추가 할 것입니다 ...

Perl은 원래 텍스트 처리 언어이므로 생물 정보학에서 널리 사용 됩니다 .

텍스트는 왕이다

펄은 쉽게 할 수 있습니다 :

  • NLP 및 생물 정보학 알고리즘 구현
  • 텍스트 데이터 추출
  • 텍스트 데이터를 생성합니다.

언어는 (반) 나쁘지 않다

또한 다음과 같은 이점이 있습니다.

  • 괜찮은 표현 ,
  • 상대적으로 낮은 학습 곡선 (당신의 모든 트릭과 해킹을 발견 할 때까지) ,
  • 또한 괜찮은 성능 .

C와 동등한 속도로 실행되는 처리 프로그램을 만들 수는 없지만 개발 시간은 훨씬 열등하며 텍스트 처리 ( 강력한 정규 표현식 , 누구?) 와 관련하여 배터리가 포함되어 있어 쉽게 사용할 수 있습니다. 이러한 작업을 해결하기 위해 랩 컨텍스트에서 선택하여 사용합니다.

휴대 성과 확장 성 용이

또한 분명히 :

  • 이다 많은 플랫폼에서 휴대용 ,
  • 매우 큰 확장 라이브러리 가 제공됩니다 .

그러나 Perl에 대한 생물 정보학 (일반적으로 과학적인) 확장과 모듈이 너무 많은 이유는 위에 주어진 이유 때문입니다. 대부분의 경우, 언어의 디자인과 능력은 언어가 작업에 거의 완벽하게 맞습니다 (많은 원한이 원한을 가질 수 있음).


이 모든 것 때문에 Perl은 과학적 연구에있어 특히 경쟁자가되며 특히 처리 할 데이터가 주로 텍스트 형식 인 분야에서 경쟁자가됩니다.

물론 다른 언어가 등장하여 다른 이유로 (시장력을 높이고 가독성을 높이고, 모호한 해킹과 전문가를위한 라이너를 피하는 등의 이유로) 시장 점유율을 주장하지만 특정 측면에서 여전히 Perl과 경쟁합니다 (Ruby is 예를 들어 데이터 처리 속도가 느리기 때문에 학습 속도가 빠릅니다). 따라서 텍스트 형식, 빠른 연구주기 및 점점 커지고있는 점점 더 큰 데이터 (감사, 유전체학 및 NGS)를 다루는 생물 정보학 (또는 NLP) 영역에서 Perl은 여전히 ​​관련성이 높습니다.


실제로 maple_shaft , Charlesgeoffjentry 의 의견을 보았습니다.이 의견은 정규 표현식의 중요성도 언급했기 때문에 모든 사람이 이것을 간과하지 않았습니다. :)


6

생물 정보학에서 Perl이 인기를 얻은 주요 이유 중 하나는 관련 데이터 작업을위한 포괄적 인 모듈 세트 인 BioPerl 입니다.

그것은 처럼 보이는 대부분의 모듈이 실제로 다른 프로그램에 의해 생성 된 데이터와 작동하도록 설계되었습니다. Perl은 결국 우수한 보고 덕트 테이프를 만듭니다 .


5

도구는 운영자의 기술 수준과 채택 용이성에 의해 선택됩니다. 컴파일 된 프로그램 또는 IDE가 간단한 해석 언어를 능가하는 데 시간이 걸립니다.

Perl에는 심각한 문제, 문서화, 심각한 라이브러리 및 광범위한 무료 가용성이 있습니다. 그중 어떤 점이 마음에 들지 않습니까?


2

Perl은 다른 언어와 동일한 기능, 데이터 구성 및 방법을 가지고 있으며 가장 배우기 쉽습니다. 이는 프로그래밍 경험이 거의없는 연구자와 과학자에게 유용합니다. Perl을 쉽게 픽업하고 원하는 작업을 수행 할 수 있기 때문입니다.

또한 :

많은 온라인 지원과 무료 스크립트를 이용할 수 있으며 이는 분명히 유리합니다! =)

요컨대, 대부분의 과학자와 연구원은 일을 끝내고 가능한 한 빨리 끝내기를 원하며 Perl은 그에 딱 맞습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.