평균 온도 대비 연도 별 kWh 사용량을 나타내는 방법은 무엇입니까?

재미로, 매년 월간 가정의 전력 소비량을 도표로 표시하고 싶습니다. 그러나 나는 월별 온도에 대한 언급을 포함하여 가정이나 행동이 kWh 사용량과 관련하여 개선, 악화 또는 꾸준한 지 여부를 결정할 수 있습니다.

내가 작업하는 데이터 :

+----------+--------+-----------+----------------+----------+-----------+------------+
|  Month   | # Days | kWh Usage | Daily kWh Avg. | Avg. Low | Avg. High | Avg. Temp. |
+----------+--------+-----------+----------------+----------+-----------+------------+
| Mar 2015 |     32 |      1048 |             33 |       40 |        60 |         50 |
| Feb 2015 |     29 |      1156 |             40 |       32 |        54 |         43 |
| Jan 2015 |     33 |      1143 |             35 |       38 |        57 |         47 |
| Dec 2014 |     30 |       887 |             30 |       39 |        61 |         50 |
| Nov 2014 |     29 |       645 |             22 |       45 |        67 |         56 |
| Oct 2014 |     29 |       598 |             21 |       60 |        78 |         69 |
| Sep 2014 |     32 |       893 |             28 |       70 |        85 |         77 |
| Aug 2014 |     30 |       965 |             32 |       72 |        87 |         79 |
| Jul 2014 |     29 |       784 |             27 |       72 |        87 |         79 |
| Jun 2014 |     32 |      1018 |             32 |       69 |        87 |         78 |
| May 2014 |     30 |       702 |             23 |       63 |        82 |         72 |
| Apr 2014 |     33 |       722 |             22 |       50 |        71 |         60 |
| Mar 2014 |     29 |       830 |             29 |       41 |        62 |         52 |
| Feb 2014 |     28 |      1197 |             43 |       32 |        52 |         42 |
| Jan 2014 |     33 |      1100 |             33 |       38 |        59 |         49 |
| Dec 2013 |     30 |       856 |             29 |       40 |        63 |         51 |
| Nov 2013 |     33 |       686 |             21 |       48 |        70 |         59 |
| Oct 2013 |     30 |       527 |             18 |       61 |        77 |         69 |
| Sep 2013 |     30 |       817 |             27 |       69 |        86 |         77 |
| Aug 2013 |     28 |       991 |             35 |       72 |        86 |         79 |
| Jul 2013 |     31 |       993 |             32 |       73 |        86 |         79 |
| Jun 2013 |     30 |       847 |             28 |       66 |        83 |         74 |
| May 2013 |     29 |       605 |             21 |       59 |        76 |         67 |
| Apr 2013 |     34 |       791 |             23 |       47 |        66 |         57 |
+----------+--------+-----------+----------------+----------+-----------+------------+

월간 값을 쉽게 비교하는 세로 막 대형 차트로 시작했습니다.

월별 사용량 열 차트

높은 / 낮은 범위를 나타내는 보조 (오른쪽) 세로 축에 매핑 된 멋진 배경 영역 또는 선 그래프를 구상했지만 다년간 그룹화에 문제가 있음을 깨달았습니다.

1 년이면 쉬울 것입니다.

온도와 함께 2014 kWh 사용

매년 모든 데이터를 온도 비교를 통해 하나의 차트로 결합하는 방법을 추천 할 수 있는지 궁금합니다.

kWh 사용량을 평균 온도와 효과적으로 연관시킬 수있는 비율이 있습니까? 또는 내가 간과하고있는 다른 디스플레이 기술이 있습니까?

data-visualization

— 숀
소스

내가 제안하고 싶은 중요한 것은이 개발하는 물리적 현실, 실질적으로 유용한 에너지 비용의 모델을. 이는 원시 데이터의 시각화보다 달성 할 수있는 비용 변화를 감지하는 데 더 효과적입니다. 이 비교함으로써 SO에 제공되는 용액 , 우리의 차이에 아주 좋은 사례가 데이터에 대한 커브를 피팅 하고 의미있는 통계적 분석을 수행한다.

(이 제안은 10 년 전에 이러한 모델을 내 가정의 사용에 맞추고 해당 기간 동안의 변경 사항을 추적하는 데 적용한 모델을 기반으로합니다. 모델이 적합하면 추적 목적으로 스프레드 시트에서 쉽게 계산할 수 있습니다. 스프레드 시트 소프트웨어의 (in) 기능에 제한을받지 않아야합니다.)

이러한 데이터에 대해, 그러한 물리적으로 그럴듯한 모델은 간단한 대안 모델 (매월 평균 온도에 대한 일일 사용량의 2 차 최소 제곱 적합) 과 실질적으로 다른 에너지 비용 및 사용 패턴 그림을 생성합니다 . 결과적으로 더 단순한 모델은 에너지 사용 패턴을 이해, 예측 또는 비교하기위한 신뢰할 수있는 도구로 간주 될 수 없습니다.

분석

뉴턴의 냉각 법칙에 따르면, 대략적인 근사치로 난방 비용 (단위 시간 동안)은 외부 온도의 차이에 정비례해야합니다. $t$ 그리고 내부 온도 $t_0$ . 비례의 상수를 $-\alpha$ . 냉각 비용은 온도 차이에 비례해야하며, 비례는 비슷하지만 반드시 동일 할 필요는 없습니다. $\beta$ . (이들 각각은 주택의 단열 능력과 난방 및 냉각 시스템의 효율성에 의해 결정됩니다.)

추정 $\alpha$ 과 $\beta$ (단위 시간당 학위 당 킬로와트 (또는 달러)로 표시되는)는 달성 할 수있는 가장 중요한 것 중 하나입니다. 미래의 비용 을 예측 하고 집과 에너지 시스템의 효율성을 측정 할 수 있기 때문 입니다.

이러한 데이터는 총 전기 사용량이므로 조명, 요리, 컴퓨팅 및 엔터테인먼트와 같은 비가 열 비용이 포함됩니다. 또한이 평균 기본 에너지 사용량 (단위 시간당) 의 추정치가 있습니다. $\gamma$ : 그것은 얼마나 많은 에너지를 절약 할 수 있는지에 대한 바닥을 제공하고 알려진 크기의 효율 개선이 이루어질 때 미래의 비용을 예측할 수있게합니다. (예를 들어, 4 년 후 나는 퍼니스를 30 % 더 효율적이라고 주장한 것으로 교체했습니다.

마지막으로 (총) 근사치로 집이 거의 일정한 온도로 유지된다고 가정합니다. $t_0$ 일년 내내. (개인 모델에서는 두 가지 온도를 가정합니다. $t_0 \le t_1$ , 겨울과 여름에 각각 해당되지만이 예제에는 두 데이터를 모두 안정적으로 추정 할 수있는 데이터가 충분하지 않으며 어쨌든 매우 가깝습니다.)이 값을 알면 집을 약간 다르게 유지 한 결과를 평가하는 데 도움이됩니다. 중요한 에너지 절약 옵션 중 하나 인 온도.

이 데이터는 외부 적으로 온도가 변동하는 기간 동안의 총 비용 을 반영 하며 일반적으로 매월 연간 범위의 약 1/4 정도 변동합니다. 우리가 볼 수 있듯이 이것은 방금 설명한 정확한 기본 순간 모델과 월 총계의 값 사이에 상당한 차이를 만듭니다 . 그 효과는 특히 난방과 냉방이 모두 발생하는 중간 기간에 특히 두드러집니다. 이 변형을 설명하지 않는 모든 모델은 실수로 에너지 비용을 "생각"해야합니다. $\gamma$ 한 달 동안 평균 온도가 $t_0$ 그러나 현실은 크게 다릅니다.

월간 온도 변동에 대한 자세한 정보는 범위를 제외하고는 (쉽게) 없습니다. 실용적이지만 약간 일관성이없는 접근 방식으로 처리를 제안합니다. 극한의 온도를 제외하고는 매월 온도가 점차적으로 증가하거나 감소합니다. 이것은 분포를 대략 균일하게 할 수 있음을 의미합니다. 균일 변수의 범위에 길이가있는 경우 $L$ 해당 변수의 표준 편차는 $s = L/\sqrt{6}$ . 나는 (에서 범위를 변환하려면이 관계를 사용 Avg. Low하는 Avg. High표준 편차로). 그러나 기본적으로 잘 동작하는 모델을 얻기 위해 정규 분포 (이 추정 된 SD 및 평균으로 제공 Avg. Temp) 를 사용하여 이러한 범위의 끝에서 변동을 줄이려고합니다 .

마지막으로 데이터를 공통 단위 시간으로 표준화해야합니다. Daily kWh Avg.변수에 이미 존재하지만 정밀도가 부족하므로 손실 된 정밀도를 되찾기 위해 총계를 일 수로 나눕니다.

따라서 단위 시간 냉각 비용의 모델 $Y$ 실외 온도에서 $t$ 이다

와이 (티) = γ + α (티 - 티_{0}) 나는 (티 < 티_{0}) + β (티 - 티_{0}) 나는 (티 > 티_{0}) + ε (티)

$y(t) = \gamma + \alpha(t-t_0)I(t\lt t_0) + \beta(t-t_0)I(t\gt t_0) + \varepsilon(t)$

어디 $I$ 표시기 기능이며 $\varepsilon$ 이 모델에서 명시 적으로 캡처되지 않은 모든 것을 나타냅니다. 추정 할 4 가지 매개 변수가 있습니다. $\alpha,\beta,\gamma$ , $t_0$ . (정말 확신한다면 $t_0$ 값을 추정하지 않고 고칠 수 있습니다.)

보고 기간 동안 총 비용 $x_0$ 에 $x_1$ 때 온도 $t(x)$ 시간에 따라 다르다 $x$ 그러므로

\begin{aligned} 비용 ({엑스}_{0}, {엑스}_{1}) = \int_{{엑스}_{0}}^{{엑스}_{1}} 와이 (티) 디 티 \\ = \int_{{엑스}_{0}}^{{엑스}_{1}} (γ + α (티 (엑스) - 티_{0}) 나는 (티 (엑스) < 티_{0}) + β (티 (엑스) - 티_{0}) 나는 (티 (엑스) > 티_{0}) + ε (티 (엑스))) 티^{'} (엑스) 디 엑스 . \end{aligned}

$\eqalign{ &\text{Cost}(x_0,x_1) = \int_{x_0}^{x_1} y(t)dt \\ &=\int_{x_0}^{x_1} \left(\gamma + \alpha(t(x)-t_0)I(t(x)\lt t_0) + \beta(t(x)-t_0)I(t(x)\gt t_0) + \varepsilon(t(x))\right) t^\prime(x) dx. }$

모형이 전혀 좋지 않다면 $\varepsilon(t)$ 평균값을 가져야한다 $\bar\varepsilon$ 0에 가까우며 월마다 무작위로 변경되는 것으로 보입니다. 변동의 근사치 $t(x)$ 평균의 정규 분포로 $\bar{t}$ (매월 평균) 및 표준 편차 $s(\bar t)$ (이전에 월별 범위에서 주 었음) 및 적분 수율 수행

\bar{와이} (\bar{티}) = γ + (β - α) 에스 (\bar{티})^{2} ϕ_{에스} (\bar{티} - 티_{0}) + (\bar{티} - 티_{0}) (β + (α - β) Φ_{에스} (티_{0} - \bar{티})) + \bar{ε} (\bar{티}) .

$\bar{y}(\bar{t}) = \gamma + (\beta-\alpha)s(\bar t)^2 \phi_s(\bar t-t_0) + (\bar{t}-t_0)\left(\beta + (\alpha-\beta)\Phi_s(t_0 - \bar{t})\right) + \bar\varepsilon(\bar{t}).$

이 공식에서 $\Phi_s$ 평균과 표준 편차가 0 인 정규 변량의 누적 분포입니다. $s(\bar t)$ ; $\phi$ 밀도입니다.

모델 피팅

이 모델은 비용과 온도 간의 비선형 관계를 표현하지만 변수에서 선형 적입니다. $\alpha,\beta,$ 과 $\gamma$ . 그러나 비선형이기 때문에 $t_0$ , $t_0$ 알 수없는 경우 비선형 피팅 절차가 필요합니다. 설명하기 위해 간단히 R계산에 사용하는 가능성 최대화 프로그램에 덤프했습니다 . $\bar\varepsilon$ 평균이 0이고 공통 표준 편차가 정규 분포를 갖는 독립적이고 동일하게 분포 $\sigma$ .

이 데이터에 대한 추정치는

(\hat{α}, \hat{β}, \hat{γ}, \hat{티_{0}}, \hat{σ}) = (- 1.489, 1.371, 10.2, 63.4, 1.80) .

$(\hat\alpha,\hat\beta,\hat\gamma,\hat {t_0}, \hat\sigma) = (-1.489, 1.371, 10.2, 63.4, 1.80).$

이것은 다음을 의미합니다.

가열 비용은 대략 $1.49$ kWh / 일 /도 F.
냉각 비용은 대략 $1.37$ kWh / 일 /도 F. 냉각이 조금 더 효율적입니다.
기본 (비가 열 / 냉각) 에너지 사용량은 $10.2$ kWh / 일 (이 수치는 상당히 불확실합니다. 추가 데이터를 사용하면 더 잘 파악할 수 있습니다.)
집은 근처 온도에서 유지됩니다 $63.4$ 화씨
모형에서 명시 적으로 설명되지 않은 다른 변형은 표준 편차가 $1.80$ kWh / 일

이러한 추정치에서 신뢰 구간과 불확실성의 다른 정량적 표현은 최대 가능성 기계 장치를 사용하여 표준 방식으로 얻을 수 있습니다.

심상

이 모델을 설명하기 위해 다음 그림은 데이터, 기본 모델, 월간 평균에 대한 적합도 및 최소 제곱 법에 대한 최소 제곱 법을 보여줍니다.

월간 데이터는 어두운 십자가로 표시됩니다. 그들이 놓인 회색 회색 선은 월별 온도 범위를 보여줍니다. 뉴턴의 법칙을 반영하는 우리의 기본 모델은 빨간색과 파란색 선분이 $t_0$ . 데이터에 대한 우리의 적합 은 온도 범위에 의존하기 때문에 곡선이 아닙니다 . 따라서 개별 파란색과 빨간색 점으로 표시됩니다. 그럼에도 불구하고 월별 범위는 크게 다르지 않기 때문에 이러한 점은 곡선을 추적하는 것처럼 보입니다 (대표 2 차 곡선과 거의 동일). 마지막으로 점선 곡선은 2 차 최소 제곱에 적합합니다 (어두운 십자가에 적합). ).

특히 중간 온도에서 피팅이 기본 (순시) 모델에서 얼마나 많이 벗어 났는지 확인하십시오! 이것은 월 평균의 효과입니다. (빨간색과 파란색 선의 높이가 각 수평 회색 선분에 걸쳐 "번져"있다고 생각하십시오. 극한의 온도에서는 모든 선이 중앙에 위치하지만 중간 온도에서는 "V"의 양면이 평균화되어 필요를 반영합니다. 한 달 동안 가열하고 다른 달에 냉각하기 위해).

모델 비교

두 가지 적합 (여기서 열심히 개발 된 것과 단순하고 손쉬운 이차 적합)은 서로 및 데이터 요소와 밀접하게 일치합니다. 이차 적합은 그리 좋지는 않지만 여전히 괜찮습니다 : 조정 된 평균 잔차 (3 개의 매개 변수)는 다음과 같습니다. $2.07$ kWh / 일, 뉴턴의 법칙 모델의 조정 평균 잔차 (4 개의 매개 변수)는 $1.97$ kWh / 일, 약 5 % 감소 데이터 포인트를 통해 곡선을 그리는 것만이라면 이차 적합의 단순성과 상대 충실도가 권장됩니다.

그러나 이차적 적합은 진행 상황을 학습하는 데 전혀 쓸모가 없습니다! 그 공식,

\bar{와이} (\bar{티}) = 219.95 - 6.241 \bar{티} + 0.04879 (\bar{티})^{2},

$\bar y(\bar t) = 219.95 - 6.241 \bar t + 0.04879 (\bar t)^2,$

직접 사용하는 것은 없습니다. 모든 공정성에서 우리는 그것을 조금 분석 할 수있었습니다.

이것은 정점이있는 포물선입니다 $\hat t_0 = 6.241/(2\times 0.04879) = 64.0$ 우리는 이것을 일정한 집 온도의 추정치로 취할 수 있습니다. 첫 번째 추정치와 크게 다르지 않습니다. $63.4$ 도. 그러나이 온도에서의 예상 비용은 $219.95 - 6.241(63.4) + 0.04879(63.4)^2 = 20.4$ kWh / 일 이것은 뉴턴의 법칙에 맞는 기본 에너지 사용량의 두 배 입니다.
가열 또는 냉각의 한계 비용은 미분 값의 절대 값에서 얻습니다. $\bar{y}^\prime(\bar t) = -6.241 + 2(0.04879)\bar{t}$ . 예를 들어,이 공식을 사용하면 외부 온도가 높을 때 집 난방 비용을 추정 할 수 있습니다 $90$ 도 $-6.241 + 2(0.04879)(90) = 2.54$ kWh / day / degree F. 뉴턴의 법칙으로 추정 한 값의 두 배 입니다.

마찬가지로 실외 온도에서 집을 난방하는 비용 $32$ 정도는 다음과 같이 추정됩니다 $|-6.241 + 2(0.04879)(32)| = 3.12$ kWh / 일 /도 F. 이것은 뉴턴의 법칙에 의해 추정 된 값의 두 배 이상입니다.

중간 온도에서 2 차 피팅은 다른 방향으로 잘못됩니다. 실제로, 정점에서 $60$ 에 $68$ 이 평균 온도는 쿨한 날로 구성 되더라도 거의 영 (0)의 한계 가열 또는 냉각 비용을 예측 합니다. $50$ 정도 그리고 따뜻한 $78$ 도. (이 게시물을 읽는 사람은 아직 열이 차단됩니다. $50$ 도 (= $10$ C)!)

간단히 말해서, 시각화에서 거의 우수 해 보이지만 , 2 차 적합은 에너지 사용과 관련된 기본 관심 량을 추정하는 데 크게 오류가 있습니다. 따라서 사용량의 변화를 평가하는 데 문제가 있으므로 사용하지 않는 것이 좋습니다.

계산

이 R코드는 모든 컴퓨팅 및 플로팅을 수행했습니다. 유사한 데이터 세트에 쉽게 적용 할 수 있습니다.

#
# Read and process the raw data.
#
x <- read.csv("F:/temp/energy.csv")
x$Daily <- x$Usage / x$Length
x <- x[order(x$Temp), ]
#pairs(x)
#
# Fit a quadratic curve.
#
fit.quadratic <- lm(Daily ~ Temp+I(Temp^2), data=x)
# par(mfrow=c(2,2))
# plot(fit.quadratic)
# par(mfrow=c(1,1))
#
# Fit a simple but realistic heating-cooling model with maximum likelihood.
#
response <- function(theta, x, s) {
  alpha <- theta[1]; beta <- theta[2]; gamma <- theta[3]; t.0 <- theta[4]
  x <- x - t.0
  gamma + (beta-alpha)*s^2*dnorm(x, 0, s) +  x*(beta + (alpha-beta)*pnorm(-x, 0, s))
}
log.L <- function(theta, y, x, s) {
  #   theta = (alpha, beta, gamma, t.0, sigma)
  #   x = time
  #   s = estimated SD
  #   y = response
  y.hat <- response(theta, x, s)
  sigma <- theta[5]
  sum((((y - y.hat) / sigma) ^2 + log(2 * pi * sigma^2))/2)
}
theta <- c(alpha=-1, beta=5/4, gamma=20, t.0=65, sigma=2) # Initial guess
x$Spread <- (x$Temp.high - x$Temp.low)/sqrt(6)            # Uniform estimate
fit <- nlm(log.L, theta, y=x$Daily, x=x$Temp, x$Spread)
names(fit$estimate) <- names(theta)
#$
# Set up for plotting.
#
i.pad <- 10
plot(range(x$Temp)+c(-i.pad,i.pad), c(0, max(x$Daily)+20), type="n", 
     xlab="Temp", ylab="Cost, kWh/day",
     main="Data, Model, and Fits")
#
# Plot the data.
#
l <- matrix(mapply(function(l,r,h) {c(l,h,r,h,NA,NA)}, 
                   x$Temp.low, x$Temp.high, x$Daily), 2)
lines(l[1,], l[2,], col="Gray")
points(x$Temp, x$Daily, type="p", pch=3)
#
# Draw the models.
#
x0 <- seq(min(x$Temp)-i.pad, max(x$Temp)+i.pad, length.out=401)
lines(x0, cbind(1, x0, x0^2) %*% coef(fit.quadratic), lwd=3, lty=3)
#curve(response(fit$estimate, x, 0), add=TRUE, lwd=2, lty=1)
t.0 <- fit$estimate["t.0"]
alpha <- fit$estimate["alpha"]
beta <- fit$estimate["beta"]
gamma <- fit$estimate["gamma"]
cool <- "#1020c0"; heat <- "#c02010"
lines(c(t.0, 0), gamma + c(0, -alpha*t.0), lwd=2, lty=1, col=cool)
lines(c(t.0, 100), gamma + c(0, beta*(100-t.0)), lwd=2, lty=1, col=heat)
#
# Display the fit.
#
pred <- response(fit$estimate, x$Temp, x$Spread)
points(x$Temp, pred, pch=16, cex=1, col=ifelse(x$Temp < t.0, cool, heat))
#lines(lowess(x$Temp, pred, f=1/4))
#
# Estimate the residual standard deviations.
#
residuals <- x$Daily - pred
sqrt(sum(residuals^2) / (length(residuals) - 4))
sqrt(sum(resid(fit.quadratic)^2) / (length(residuals) - 3))

— 우버
소스

이것은 내가 읽은 모든 스택 오버플로 질문에 대한 최선의 응답 일 수 있습니다. 솔루션의 논리와 추론을 설명하는 데 걸린 시간에 크게 감사드립니다.

— Shawn

물리학은 이보다 더 털이 있습니다. 응축기와 증발기 스위치는 가열과 냉각의 역할을합니다. 이는 두 개의 다른 시스템처럼 작동하며 하나의 연속 시스템이 아니라는 것을 의미합니다. 난방도 일, 냉각도 일 및 제습도 일은 세 개의 분리 된 비용 동인이며 지리적 위치 (k, wi, ca, az, mo, fl)와 연도에 따라 불 연속적으로 작용할 수 있습니다 (가열 시즌 종료는 냉각 시작과 동일하지 않습니다). 데이터에 대한 적절한 통계에 따르면 4 시즌이 아니라 5 시즌이 있다고합니다. 5 월은 지난 5 년 이내에 자체 시즌입니다.

— EngrStudent

@EngrStudent 모든 좋은 점과 많은 감사합니다. 여기에 제시된 접근 방식은 단순화되었지만 이러한 미묘한 영향을 유발하기위한 기반을 마련하는 데 필요한 것을 보여줍니다. 모델에서 큰 용어를 처리하고 온도가 비용에 지배적 인 기여자가되어야한다는 것을 아무도 부정하지 않을 것이라고 생각 합니다. 따라서 물리적으로 의미있는 방식으로 수행 한 경우 다른 용어를 식별 할 수 있습니다 아마도 그 효과를 정확하게 추정 할 수도 있습니다. 큰 용어를 올바르게 다루지 않으면 다른 사람들을 특성화 할 희망이 없습니다.

— whuber

나는이 좋은 기초 / 분석을 좋아합니다. 비판이 아니라 박수로 들어주세요. 가열 과정은 냉각 과정과 다르기 때문에 양쪽에있는 비 편차 2 차법은 그와 상충 될 수 있습니다. 증발기 코일은 냉각 중 실내와 난방 중 야외에 있습니다. 히트 펌프에는 제상 사이클링 및 "백업 백업"도 있습니다. 또한 압축기는 더 극단적 인 실외 온도에 맞서 싸우기 위해 더 열심히 노력해야하므로 더 많은 열을 이동시킬뿐만 아니라 더 높은 언덕 위로 이동해야합니다. 선형이 아닙니다. 습도는 크며 에너지 예산의 2/3가 될 수 있습니다. 공기 침투.

— EngrStudent

@EngrStudent 다시 한 번 감사드립니다. 모두 흥미로운 포인트입니다. 습도가 예산의 많은 부분을 차지할지도 모른다는 생각이 들었습니다. 그것은 좋은 이론 (또는 일부 원에서 "개념적 모델")을 통계적 분석과 결합시키는 잠재적 가치를 보여주는 일종의 관찰이다.

— whuber

StackOverflow 에서 답변을 받았습니다 . 누구든지 추가로 생각하면 대안 솔루션에 여전히 관심이 있습니다.

/programming/29777890/data-visualization-how-to-represent-kwh-usage-by-year-against-average-temperatu

— 숀
소스

SO의 해결책은 믿어지지 않습니다. 출발점으로 유용한 합리적인 1 차 근사치 인 Newton의 냉각 법칙에 따르면 에너지 사용량과 온도는 두 선 (아마도 다른 기울기)의 합집합이어야합니다. 평균은 매일 (그리고 시간당) 온도 변동을 숨겨서 해당 라인의 교차점 (가열이나 냉각이 필요하지 않은)에서 영역을 흐리게합니다. 이차 적합은 합리적 일 수 있지만 점근 적으로 적합은 선형이어야 합니다.

— whuber

평균 흐림 정확도는 있지만 그 데이터는 알고 있습니다. 때문에 나는이 문구를 파악하지 통계의 이해 부족에 "... 두 줄의 결합해야한다" 와 "선형하는 점근 적 적합성 요구" . 초보 POV에서 SO 포스트는 가열이나 냉각이 필요하지 않은 중간 범위에서 가장 낮 으면서 온도 스케일의 반대쪽 끝에서 에너지 소비가 증가 할 것이라는 기대에 부응하기 때문에 직관적으로 보입니다. 이차 적합이 대칭 적이 지 않습니까? 냉방보다 더 많은 전력을 사용하기 때문에 전력 사용량이 대칭 적이라고 생각하지 않습니다. 정정이나 조언에 감사드립니다.

— Shawn

2 차 적합은 대칭 적이지만 극단적으로는 비 물리적입니다. 왜냐하면 물리적으로 그럴듯한 것보다 가장 낮은 온도에서 가열하고 가장 높은 온도에서 냉각에 훨씬 더 많은 비용을 지불 할 것이기 때문입니다. 또한, 플롯 당 대칭은 하우스 당 냉각 비용이 도당 가열 비용과 동일 할 때만 예상되며, 이는 난방 및 냉각 시스템이 동일하게 효율적이라고 가정합니다. 그럴 수도 있고 아닐 수도 있지만 모델에 해당 대칭을 적용해서는 안됩니다.

— whuber

나는 학위 당 열보다 냉각하는 데 비용이 많이 들기 때문에 그것이 다르다는 것에 동의합니다. 그러나 첫 번째 의견을 이해합니다. 합리적이지만 SO 포스트의 2 차 피팅이 실제로 정확하지는 않으며 선형 피팅이 뉴턴의 냉각 법칙으로 인해 기술적으로 정답이라고 제안합니까? 내가 이해하지 못하는 것은 SO 솔루션 의 불가능입니다 .

— Shawn

주석을 넣을 공간의 마지막 질문에 대한 응답을 맞출 수 없으므로 대신 답변으로 게시했습니다. 그래도 도당 냉각 비용이 도당 난방 비용보다 높다는 것을 어떻게 알 수 있는지 모르겠습니다. 귀하의 데이터는 그 반대가 사실임을 나타냅니다 (비용은 예상대로 꽤 가깝지만). 그리고 선형 모델 은 선형 적합을 의미하지 않습니다 ! 이 기본 모델에서 데이터를 체계적으로 벗어나게 만드는 많은 작업이 있습니다.

— whuber