Ruby에서 문자열을 연결하는보다 우아한 방법을 찾고 있습니다.
다음 줄이 있습니다.
source = "#{ROOT_DIR}/" << project << "/App.config"
더 좋은 방법이 있습니까?
그리고 그 문제의 차이 무엇 <<
과 +
?
Ruby에서 문자열을 연결하는보다 우아한 방법을 찾고 있습니다.
다음 줄이 있습니다.
source = "#{ROOT_DIR}/" << project << "/App.config"
더 좋은 방법이 있습니까?
그리고 그 문제의 차이 무엇 <<
과 +
?
답변:
여러 가지 방법으로이를 수행 할 수 있습니다.
<<
었지만 그것은 일반적인 방법 이 아닙니다문자열 보간
source = "#{ROOT_DIR}/#{project}/App.config"
와 +
source = "#{ROOT_DIR}/" + project + "/App.config"
두 번째 방법은 내가 본 것보다 메모리 / 속도면에서 더 효율적인 것으로 보입니다 (측정하지는 않음). ROOT_DIR이 nil이면 세 가지 방법 모두 초기화되지 않은 상수 오류를 발생시킵니다.
경로 이름을 다룰 때 File.join
경로 이름 구분 기호가 엉망이되는 것을 피하기 위해 사용할 수 있습니다 .
결국, 그것은 맛의 문제입니다.
그만큼 +
운영자는 일반적인 연결 선택이며, 아마도 CONCATENATE 문자열 가장 빠른 방법입니다.
차이 +
와 <<
즉 <<
그 왼쪽에있는 물체를 변경 한 +
하지 않는다.
irb(main):001:0> s = 'a'
=> "a"
irb(main):002:0> s + 'b'
=> "ab"
irb(main):003:0> s
=> "a"
irb(main):004:0> s << 'b'
=> "ab"
irb(main):005:0> s
=> "ab"
+
와 <<
거의 동일 할 것입니다. 많은 문자열 또는 실제로 큰 문자열을 다루는 경우 차이가있을 수 있습니다. 나는 그들이 비슷한 성능에 놀랐습니다. gist.github.com/2895311
5.times do ... end
각 인터프리터에 대해 테스트 스위트를 여러 번 실행하면 (동일한 프로세스에서 모든 것을 블록으로 감싸서 ) 더 정확한 결과를 얻을 수 있습니다. 내 테스트에서 보간이 모든 Ruby 인터프리터에서 가장 빠른 방법임을 보여주었습니다. <<
가장 빠를 것으로 예상 했지만 벤치마킹하는 이유입니다.
에서 http://greyblake.com/blog/2012/09/02/ruby-perfomance-tricks/
후자는 임시 객체를 만들고 첫 번째 객체를 새 객체로 재정의하므로 <<
aka를 사용하는 concat
것이보다 효율적 +=
입니다.
require 'benchmark'
N = 1000
BASIC_LENGTH = 10
5.times do |factor|
length = BASIC_LENGTH * (10 ** factor)
puts "_" * 60 + "\nLENGTH: #{length}"
Benchmark.bm(10, '+= VS <<') do |x|
concat_report = x.report("+=") do
str1 = ""
str2 = "s" * length
N.times { str1 += str2 }
end
modify_report = x.report("<<") do
str1 = "s"
str2 = "s" * length
N.times { str1 << str2 }
end
[concat_report / modify_report]
end
end
산출:
____________________________________________________________
LENGTH: 10
user system total real
+= 0.000000 0.000000 0.000000 ( 0.004671)
<< 0.000000 0.000000 0.000000 ( 0.000176)
+= VS << NaN NaN NaN ( 26.508796)
____________________________________________________________
LENGTH: 100
user system total real
+= 0.020000 0.000000 0.020000 ( 0.022995)
<< 0.000000 0.000000 0.000000 ( 0.000226)
+= VS << Inf NaN NaN (101.845829)
____________________________________________________________
LENGTH: 1000
user system total real
+= 0.270000 0.120000 0.390000 ( 0.390888)
<< 0.000000 0.000000 0.000000 ( 0.001730)
+= VS << Inf Inf NaN (225.920077)
____________________________________________________________
LENGTH: 10000
user system total real
+= 3.660000 1.570000 5.230000 ( 5.233861)
<< 0.000000 0.010000 0.010000 ( 0.015099)
+= VS << Inf 157.000000 NaN (346.629692)
____________________________________________________________
LENGTH: 100000
user system total real
+= 31.270000 16.990000 48.260000 ( 48.328511)
<< 0.050000 0.050000 0.100000 ( 0.105993)
+= VS << 625.400000 339.800000 NaN (455.961373)
이 요점에서 영감을 얻은 또 다른 벤치 마크가 있습니다. 동적 및 사전 정의 된 문자열에 대한 연결 ( +
), 추가 ( <<
) 및 보간 ( #{}
)을 비교합니다 .
require 'benchmark'
# we will need the CAPTION and FORMAT constants:
include Benchmark
count = 100_000
puts "Dynamic strings"
Benchmark.benchmark(CAPTION, 7, FORMAT) do |bm|
bm.report("concat") { count.times { 11.to_s + '/' + 12.to_s } }
bm.report("append") { count.times { 11.to_s << '/' << 12.to_s } }
bm.report("interp") { count.times { "#{11}/#{12}" } }
end
puts "\nPredefined strings"
s11 = "11"
s12 = "12"
Benchmark.benchmark(CAPTION, 7, FORMAT) do |bm|
bm.report("concat") { count.times { s11 + '/' + s12 } }
bm.report("append") { count.times { s11 << '/' << s12 } }
bm.report("interp") { count.times { "#{s11}/#{s12}" } }
end
산출:
Dynamic strings
user system total real
concat 0.050000 0.000000 0.050000 ( 0.047770)
append 0.040000 0.000000 0.040000 ( 0.042724)
interp 0.050000 0.000000 0.050000 ( 0.051736)
Predefined strings
user system total real
concat 0.030000 0.000000 0.030000 ( 0.024888)
append 0.020000 0.000000 0.020000 ( 0.023373)
interp 3.160000 0.160000 3.320000 ( 3.311253)
결론 : MRI의 보간법은 무겁습니다.
Pathname을 사용하고 싶습니다.
require 'pathname' # pathname is in stdlib
Pathname(ROOT_DIR) + project + 'App.config'
약 <<
및 +
루비 문서에서 :
+
: str에 연결된 other_str을 포함 하는 새로운 문자열을 반환
<<
: 주어진 객체를 str에 연결합니다. 오브젝트가 0-255 사이의 Fixnum 인 경우, 연결하기 전에 문자로 변환됩니다.
차이는 첫 번째 피연산자로 될 것입니다 때문에 ( <<
장소 변경합니다 +
(첫 번째 피연산자가 Fixnum이라는 경우가 될 것입니다 무엇을 반환 새 문자열이 메모리가 무거운 정도) <<
가 코드 문자가 그 수만큼 인 것처럼 추가합니다, +
올릴 것이다 오류)
Pathname('/home/foo') + '/etc/passwd' # => #<Pathname:/etc/passwd>
. 이것은 루비 독 예제를 기반으로 의도적으로 설계된 것입니다. File.join이 더 안전한 것 같습니다.
(Pathname(ROOT_DIR) + project + 'App.config').to_s
문자열 객체를 반환 하려면 호출해야 합니다.
그것에 대한 모든 경험을 보여 드리겠습니다.
32k의 레코드를 반환하는 쿼리가있었습니다. 각 레코드마다 데이터베이스 레코드를 형식화 된 문자열로 형식화하는 방법을 호출 하고이 모든 프로세스가 끝나면 디스크의 파일로 변환되는 문자열로 연결합니다.
내 문제는 레코드가 24k 전후에 문자열을 연결하는 프로세스가 고통을 겪었다는 것입니다.
나는 정규 '+'연산자를 사용하여 그렇게하고있었습니다.
'<<'로 바꾸었을 때 마술 같았습니다. 정말 빠르다.
그래서 Java를 사용하고 '+'를 사용하여 String을 연결하고 String에서 StringBuffer로 변경했을 때 (1998 년 일종의) 옛날을 기억했습니다 (이제 Java 개발자에게는 StringBuilder가 있습니다).
Ruby 세계에서 + / <<의 프로세스는 Java 세계에서 + / StringBuilder.append와 동일하다고 생각합니다.
첫 번째는 전체 객체를 메모리에 재 할당하고 다른 하나는 새 주소를 가리 킵니다.
당신이 말하는 연결? 그럼 방법은 #concat
어떻습니까?
a = 'foo'
a.object_id #=> some number
a.concat 'bar' #=> foobar
a.object_id #=> same as before -- string a remains the same object
모든 공정성에서 concat
로 별칭이 지정됩니다 <<
.
"foo" "bar" 'baz" #=> "foobarabaz"
+
또는 <<
연산자를 사용할 수 있지만 루비 .concat
기능은 다른 연산자보다 훨씬 빠르기 때문에 가장 선호되는 기능입니다. 당신은 그것을 사용할 수 있습니다.
source = "#{ROOT_DIR}/".concat(project.concat("/App.config"))
.
마지막 concat
아니 후 여분의 것을 생각 하십니까?
상황은 다음과 같습니다.
# this will not work
output = ''
Users.all.each do |user|
output + "#{user.email}\n"
end
# the output will be ''
puts output
# this will do the job
output = ''
Users.all.each do |user|
output << "#{user.email}\n"
end
# will get the desired output
puts output
첫 번째 예에서 +
operator 와 연결 하면 output
객체가 업데이트되지 않지만 두 번째 예에서는 <<
연산자가 output
각 반복마다 객체를 업데이트합니다 . 따라서 위의 유형의 상황에서는 <<
더 좋습니다.
특정 경우에는 Array#join
파일 경로 유형의 문자열을 구성 할 때도 사용할 수 있습니다 .
string = [ROOT_DIR, project, 'App.config'].join('/')]
이것은 다른 유형을 문자열로 자동 변환하는 유쾌한 부작용이 있습니다.
['foo', :bar, 1].join('/')
=>"foo/bar/1"