업로드하기 전에 자바 스크립트로 파일 MIME 유형을 확인하는 방법은 무엇입니까?


177

내가 읽은 파일의 MIME 유형이 클라이언트 측에서 자바 스크립트를 사용하여 검사 할 수 있음을 시사하는 것 같다 질문입니다. 이제 실제 검증은 여전히 ​​서버 측에서 수행되어야한다는 것을 알고 있습니다. 불필요한 서버 리소스 낭비를 피하기 위해 클라이언트 측 검사를 수행하고 싶습니다.

클라이언트 측 에서이 작업을 수행 할 수 있는지 테스트하기 위해 JPEG테스트 파일 의 확장자를로 변경하고 .png업로드 할 파일을 선택했습니다. 파일을 보내기 전에 자바 스크립트 콘솔을 사용하여 파일 객체를 쿼리합니다.

document.getElementsByTagName('input')[0].files[0];

이것이 Chrome 28.0에서 얻는 것입니다.

{webkitRelativePath : "", lastModifiedDate : 2012 년 10 월 16 일 화요일 10:00:00 GMT + 0000 (UTC), 이름 : "test.png", 유형 : "image / png", 크기 : 500055…}

image/png검사가 MIME 유형 대신 파일 확장자를 기반으로 수행되었음을 나타내는 것으로 보이는 유형을 보여줍니다 . Firefox 22.0을 사용해 보니 같은 결과를 얻습니다. 그러나 W3C 사양에 따르면 MIME 스니핑 을 구현해야합니다.

현재 자바 스크립트로 MIME 유형을 확인할 수있는 방법이 없다고 말할 수 있습니까? 아니면 뭔가 빠졌습니까?


5
I want to perform a client side checking to avoid unnecessary wastage of server resource.서버 쪽에서 유효성 검사를 수행해야하는 이유를 이해하지 못했지만 서버 리소스를 줄이려고한다고 말합니다. 황금률 : 절대 사용자 입력을 신뢰하지 않습니다 . 서버 측에서 MIME 유형을 확인하는 경우 클라이언트 측에서 MIME 유형을 확인하는 것이 중요합니다. 확실히 "불필요한 고객 자원 낭비 "입니까?
Ian Clark

7
더 나은 파일 형식 검사 / 피드백을 클라이언트 측 사용자에게 제공하는 것이 좋습니다. 그러나 언급했듯이 브라우저 typeFile객체 의 속성 값을 결정할 때 파일 확장자를 사용하기 만하면 됩니다. 예를 들어, 웹킷 소스 코드는이 사실을 보여줍니다. 파일에서 "매직 바이트"를 찾아서 클라이언트 측에서 파일을 정확하게 식별 할 수 있습니다. 나는 현재 그 일을 할 MIT 라이브러리 (빈 시간이 거의 없음)에서 일하고 있습니다. 내 진행 상황에 관심이 있다면 github.com/rnicholus/determinater를 살펴 보십시오 .
레이 니콜러스

32
@IanClark, 요점은 파일이 잘못된 유형 인 경우 서버 측에서 파일을 거부하기 위해 업로드 대역폭을 낭비하지 않고 클라이언트 측에서 파일을 거부 할 수 있다는 것입니다.
질문 오버플로

@ RayNicholus, 멋진 친구! 내가 시간이되면 그것을 통해 볼 것입니다. 감사합니다 :)
질문 오버플로

테스트 파일에 여전히 mimetype이 image/jpeg있고 확장명을 변경하여 실제로 수정하지 않았습니까?
Bergi

답변:


343

FileReader서버에 업로드하기 전에 JavaScript를 사용하여 파일 MIME 유형을 쉽게 확인할 수 있습니다 . 클라이언트 쪽보다 서버 쪽 확인을 선호하지만 클라이언트 쪽 확인은 여전히 ​​가능하다는 데 동의합니다. 하단에 실습 데모를 제공하는 방법을 보여 드리겠습니다.


브라우저를 모두 지원하는지 확인 File하고 Blob. 모든 주요한 것.

if (window.FileReader && window.Blob) {
    // All the File APIs are supported.
} else {
    // File and Blob are not supported
}

1 단계:

다음 과 같은 요소 에서 File정보를 검색 할 수 있습니다 <input>( ref ).

<input type="file" id="your-files" multiple>
<script>
var control = document.getElementById("your-files");
control.addEventListener("change", function(event) {
    // When the control has changed, there are new files
    var files = control.files,
    for (var i = 0; i < files.length; i++) {
        console.log("Filename: " + files[i].name);
        console.log("Type: " + files[i].type);
        console.log("Size: " + files[i].size + " bytes");
    }
}, false);
</script>

위의 드래그 앤 드롭 버전 ( ref )은 다음과 같습니다.

<div id="your-files"></div>
<script>
var target = document.getElementById("your-files");
target.addEventListener("dragover", function(event) {
    event.preventDefault();
}, false);

target.addEventListener("drop", function(event) {
    // Cancel default actions
    event.preventDefault();
    var files = event.dataTransfer.files,
    for (var i = 0; i < files.length; i++) {
        console.log("Filename: " + files[i].name);
        console.log("Type: " + files[i].type);
        console.log("Size: " + files[i].size + " bytes");
    }
}, false);
</script>

2 단계:

이제 파일을 검사하고 헤더 및 MIME 유형을 정리할 수 있습니다.

✘ 빠른 방법

이 패턴을 사용하여 Blob 에게 표시하는 파일의 MIME 유형을 순진하게 요청할 수 있습니다 .

var blob = files[i]; // See step 1 above
console.log(blob.type);

이미지의 경우 MIME 유형은 다음과 같이 돌아옵니다.

이미지 / jpeg
이미지 / png
...

주의 사항 : MIME 형식은 파일 확장명에서 감지되며 속이거나 스푸핑 될 수 있습니다. a의 이름을 a .jpg로 바꾸면 .pngMIME 유형이로보고됩니다 image/png.


✓ 적절한 헤더 검사 방법

클라이언트 측 파일의 bonafide MIME 유형을 얻으려면 한 단계 더 나아가 주어진 파일의 처음 몇 바이트를 검사하여 소위 magic numbers 와 비교할 있습니다. 예를 들어 JPEG 에는 몇 가지 "마법의 숫자"가 있기 때문에 완전히 간단하지는 않습니다 . 이것은 포맷이 1991 년부터 발전했기 때문입니다. 처음 두 바이트 만 확인하면되지만, 오 탐지를 줄이기 위해 최소 4 바이트를 확인하는 것이 좋습니다.

JPEG의 파일 서명 예제 (처음 4 바이트) :

FF D8 FF E0 (SOI + ADD0)
FF D8 FF E1 (SOI + ADD1)
FF D8 FF E2 (SOI + ADD2)

파일 헤더를 검색하기위한 필수 코드는 다음과 같습니다.

var blob = files[i]; // See step 1 above
var fileReader = new FileReader();
fileReader.onloadend = function(e) {
  var arr = (new Uint8Array(e.target.result)).subarray(0, 4);
  var header = "";
  for(var i = 0; i < arr.length; i++) {
     header += arr[i].toString(16);
  }
  console.log(header);

  // Check the file signature against known types

};
fileReader.readAsArrayBuffer(blob);

그런 다음 실제 MIME 유형을 결정할 수 있습니다 ( 여기여기 에서 더 많은 파일 서명 ).

switch (header) {
    case "89504e47":
        type = "image/png";
        break;
    case "47494638":
        type = "image/gif";
        break;
    case "ffd8ffe0":
    case "ffd8ffe1":
    case "ffd8ffe2":
    case "ffd8ffe3":
    case "ffd8ffe8":
        type = "image/jpeg";
        break;
    default:
        type = "unknown"; // Or you can use the blob.type as fallback
        break;
}

예상되는 MIME 유형에 따라 파일 업로드를 승인하거나 거부합니다.


데모

다음은 로컬 파일 원격 파일에 대한 실제 데모입니다 (이 데모에서는 CORS를 무시해야했습니다). 스 니펫을 열고 실행하면 다른 유형의 원격 이미지 3 개가 표시됩니다. 상단에서 로컬 이미지 또는 데이터 파일을 선택할 수 있으며 파일 서명 및 / 또는 MIME 유형이 표시됩니다.

이미지 이름이 바뀌어도 실제 MIME 유형을 확인할 수 있습니다. 아래를 참조하십시오.

스크린 샷

데모의 예상 출력



8
2 작은 의견. (1) 파일을 읽기 전에 처음 4 바이트로 슬라이스하는 것이 낫지 않습니까? fileReader.readAsArrayBuffer(blob.slice(0,4))? (2) 파일 서명을 복사 / 붙여 넣기 위해 헤더를 선행 0으로 구성해서는 안 for(var i = 0; i < bytes.length; i++) { var byte = bytes[i]; fileSignature += (byte < 10 ? "0" : "") + byte.toString(16); }됩니까?
Matthew Madson

1
@Deadpool 여기를 참조 하십시오 . 제조업체마다 더 많고 덜 일반적인 JPEG 형식이 있습니다. 예를 들어 FF D8 FF E2= CANNON EOS JPEG FILE, FF D8 FF E3= SAMSUNG D500 JPEG FILE입니다. JPEG 서명의 핵심 부분은 2 바이트에 불과하지만 오 탐지를 줄이기 위해 가장 일반적인 4 바이트 서명을 추가했습니다. 도움이 되길 바랍니다.
Drakes

23
이 답변의 품질은 놀랍습니다.
Luca

2
mimeType을 결정하기 위해 전체 Blob을 ArrayBuffer로로드 할 필요가 없습니다. 다음과 같이 blob의 처음 4 바이트를 슬라이스하고 전달할 수 있습니다.fileReader.readAsArrayBuffer(blob.slice(0, 4))
codeVerine

2
일반 텍스트 만 허용하려면 어떤 검사를해야합니까? 텍스트 파일의 첫 4 바이트는 텍스트 파일의 첫 4자인 것 같습니다.
MP Droid

19

다른 답변에서 언급했듯이 파일의 첫 바이트에서 파일 의 서명 을 확인하여 MIME 유형을 확인할 수 있습니다 .

그러나 다른 답변은 서명을 확인하기 위해 전체 파일을 메모리로드하는 것입니다 .이 방법은 매우 낭비이며 큰 파일을 실수로 선택하면 브라우저를 쉽게 정지시킬 수 있습니다.

/**
 * Load the mime type based on the signature of the first bytes of the file
 * @param  {File}   file        A instance of File
 * @param  {Function} callback  Callback with the result
 * @author Victor www.vitim.us
 * @date   2017-03-23
 */
function loadMime(file, callback) {
    
    //List of known mimes
    var mimes = [
        {
            mime: 'image/jpeg',
            pattern: [0xFF, 0xD8, 0xFF],
            mask: [0xFF, 0xFF, 0xFF],
        },
        {
            mime: 'image/png',
            pattern: [0x89, 0x50, 0x4E, 0x47],
            mask: [0xFF, 0xFF, 0xFF, 0xFF],
        }
        // you can expand this list @see https://mimesniff.spec.whatwg.org/#matching-an-image-type-pattern
    ];

    function check(bytes, mime) {
        for (var i = 0, l = mime.mask.length; i < l; ++i) {
            if ((bytes[i] & mime.mask[i]) - mime.pattern[i] !== 0) {
                return false;
            }
        }
        return true;
    }

    var blob = file.slice(0, 4); //read the first 4 bytes of the file

    var reader = new FileReader();
    reader.onloadend = function(e) {
        if (e.target.readyState === FileReader.DONE) {
            var bytes = new Uint8Array(e.target.result);

            for (var i=0, l = mimes.length; i<l; ++i) {
                if (check(bytes, mimes[i])) return callback("Mime: " + mimes[i].mime + " <br> Browser:" + file.type);
            }

            return callback("Mime: unknown <br> Browser:" + file.type);
        }
    };
    reader.readAsArrayBuffer(blob);
}


//when selecting a file on the input
fileInput.onchange = function() {
    loadMime(fileInput.files[0], function(mime) {

        //print the output to the screen
        output.innerHTML = mime;
    });
};
<input type="file" id="fileInput">
<div id="output"></div>


오류가 있더라도 readyState항상 FileReader.DONE이벤트 처리기 ( W3C 사양 )에있을 것이라고 생각 합니다. (!e.target.error)대신 확인하지 않아야 합니까?
boycy

5

Sindresorhus는이를 직접 구현하지 않으려는 사용자를 위해 브라우저에서 작동하는 유틸리티를 만들었으며 원하는 대부분의 문서에 대한 헤더-마임 매핑이 있습니다.

https://github.com/sindresorhus/file-type

이 유틸리티를 사용하여 모든 것을 메모리에로드하는 것을 피하기 위해 Vitim.us의 첫 번째 X 바이트에서만 읽도록 제안 할 수 있습니다 (예 : es6)

import fileType from 'file-type'; // or wherever you load the dependency

const blob = file.slice(0, fileType.minimumBytes);

const reader = new FileReader();
reader.onloadend = function(e) {
  if (e.target.readyState !== FileReader.DONE) {
    return;
  }

  const bytes = new Uint8Array(e.target.result);
  const { ext, mime } = fileType.fromBuffer(bytes);

  // ext is the desired extension and mime is the mimetype
};
reader.readAsArrayBuffer(blob);

나를 위해, 최신 버전의 라이브러리는 작동하지 않았지만 작동 "file-type": "12.4.0"했고 사용해야했습니다import * as fileType from "file-type";
ssz

4

업로드 된 파일이 이미지인지 확인하려는 경우 <img>오류 콜백 확인을 위해 태그에 파일을로드 할 수 있습니다 .

예:

var input = document.getElementsByTagName('input')[0];
var reader = new FileReader();

reader.onload = function (e) {
    imageExists(e.target.result, function(exists){
        if (exists) {

            // Do something with the image file.. 

        } else {

            // different file format

        }
    });
};

reader.readAsDataURL(input.files[0]);


function imageExists(url, callback) {
    var img = new Image();
    img.onload = function() { callback(true); };
    img.onerror = function() { callback(false); };
    img.src = url;
}

1
잘 작동, 나는 .gif 파일 업 로더 해킹을 시도하고 오류가 발생했습니다 :)
패스 파인더

4

이것은 당신이해야 할 일입니다

var fileVariable =document.getElementsById('fileId').files[0];

이미지 파일 형식을 확인하려면

if(fileVariable.type.match('image.*'))
{
 alert('its an image');
}

현재 Android 용 Firefox, Android 용 Opera 및 iOS의 Safari에서는 작동하지 않습니다. developer.mozilla.org/en-US/docs/Web/API/File/type
Reid

3

다음은 webp를 지원하는 Typescript 구현입니다. 이것은 Vitim.us의 JavaScript 답변을 기반으로합니다.

interface Mime {
  mime: string;
  pattern: (number | undefined)[];
}

// tslint:disable number-literal-format
// tslint:disable no-magic-numbers
const imageMimes: Mime[] = [
  {
    mime: 'image/png',
    pattern: [0x89, 0x50, 0x4e, 0x47]
  },
  {
    mime: 'image/jpeg',
    pattern: [0xff, 0xd8, 0xff]
  },
  {
    mime: 'image/gif',
    pattern: [0x47, 0x49, 0x46, 0x38]
  },
  {
    mime: 'image/webp',
    pattern: [0x52, 0x49, 0x46, 0x46, undefined, undefined, undefined, undefined, 0x57, 0x45, 0x42, 0x50, 0x56, 0x50],
  }
  // You can expand this list @see https://mimesniff.spec.whatwg.org/#matching-an-image-type-pattern
];
// tslint:enable no-magic-numbers
// tslint:enable number-literal-format

function isMime(bytes: Uint8Array, mime: Mime): boolean {
  return mime.pattern.every((p, i) => !p || bytes[i] === p);
}

function validateImageMimeType(file: File, callback: (b: boolean) => void) {
  const numBytesNeeded = Math.max(...imageMimes.map(m => m.pattern.length));
  const blob = file.slice(0, numBytesNeeded); // Read the needed bytes of the file

  const fileReader = new FileReader();

  fileReader.onloadend = e => {
    if (!e || !fileReader.result) return;

    const bytes = new Uint8Array(fileReader.result as ArrayBuffer);

    const valid = imageMimes.some(mime => isMime(bytes, mime));

    callback(valid);
  };

  fileReader.readAsArrayBuffer(blob);
}

// When selecting a file on the input
fileInput.onchange = () => {
  const file = fileInput.files && fileInput.files[0];
  if (!file) return;

  validateImageMimeType(file, valid => {
    if (!valid) {
      alert('Not a valid image file.');
    }
  });
};

<input type="file" id="fileInput">


1

Drake가 말했듯이 FileReader 로이 작업을 수행 할 수 있습니다. 그러나 내가 여기서 제시하는 것은 기능적인 버전입니다. JavaScript로이 작업을 수행 할 때 큰 문제는 입력 파일을 재설정하는 것입니다. 글쎄, 이것은 JPG로만 제한됩니다 (다른 형식의 경우 MIME 유형마법 번호 를 변경해야합니다 ).

<form id="form-id">
  <input type="file" id="input-id" accept="image/jpeg"/>
</form>

<script type="text/javascript">
    $(function(){
        $("#input-id").on('change', function(event) {
            var file = event.target.files[0];
            if(file.size>=2*1024*1024) {
                alert("JPG images of maximum 2MB");
                $("#form-id").get(0).reset(); //the tricky part is to "empty" the input file here I reset the form.
                return;
            }

            if(!file.type.match('image/jp.*')) {
                alert("only JPG images");
                $("#form-id").get(0).reset(); //the tricky part is to "empty" the input file here I reset the form.
                return;
            }

            var fileReader = new FileReader();
            fileReader.onload = function(e) {
                var int32View = new Uint8Array(e.target.result);
                //verify the magic number
                // for JPG is 0xFF 0xD8 0xFF 0xE0 (see https://en.wikipedia.org/wiki/List_of_file_signatures)
                if(int32View.length>4 && int32View[0]==0xFF && int32View[1]==0xD8 && int32View[2]==0xFF && int32View[3]==0xE0) {
                    alert("ok!");
                } else {
                    alert("only valid JPG images");
                    $("#form-id").get(0).reset(); //the tricky part is to "empty" the input file here I reset the form.
                    return;
                }
            };
            fileReader.readAsArrayBuffer(file);
        });
    });
</script>

이는 최신 버전의 Firefox 및 Chrome 및 IExplore 10에서 테스트되었음을 ​​고려하십시오.

MIME 유형의 전체 목록은 Wikipedia를 참조하십시오 .

매직 넘버의 전체 목록은 Wikipedia를 참조하십시오 .


위의 Wikipedia 링크는 더 이상 유효하지 않습니다.
Bob Quinn

@BobQuinn 고정, thansk
lmiguelmh

0

다음은 Roberto14의 답변을 확장하여 다음을 수행합니다.

이 이미지 만 허용합니다

FileReader가 사용 가능한지 확인하고 사용 불가능한 경우 확장 확인으로 돌아갑니다.

이미지가 아닌 경우 오류 경고를 제공합니다

이미지 인 경우 미리보기를로드합니다

** 여전히 서버 측 유효성 검사를 수행해야합니다. 이는 다른 무엇보다 최종 사용자에게 더 편리합니다. 그러나 편리합니다!

<form id="myform">
    <input type="file" id="myimage" onchange="readURL(this)" />
    <img id="preview" src="#" alt="Image Preview" />
</form>

<script>
function readURL(input) {
    if (window.FileReader && window.Blob) {
        if (input.files && input.files[0]) {
            var reader = new FileReader();
            reader.onload = function (e) {
                var img = new Image();
                img.onload = function() {
                    var preview = document.getElementById('preview');
                    preview.src = e.target.result;
                    };
                img.onerror = function() { 
                    alert('error');
                    input.value = '';
                    };
                img.src = e.target.result;
                }
            reader.readAsDataURL(input.files[0]);
            }
        }
    else {
        var ext = input.value.split('.');
        ext = ext[ext.length-1].toLowerCase();      
        var arrayExtensions = ['jpg' , 'jpeg', 'png', 'bmp', 'gif'];
        if (arrayExtensions.lastIndexOf(ext) == -1) {
            alert('error');
            input.value = '';
            }
        else {
            var preview = document.getElementById('preview');
            preview.setAttribute('alt', 'Browser does not support preview.');
            }
        }
    }
</script>

-1

짧은 대답은 '아니요'입니다.

참고로 브라우저 type는 파일 확장자에서 파생 됩니다. Mac 미리보기도 확장 기능을 사용하는 것으로 보입니다. 디스크에서 파일을 찾고 읽는 것이 아니라 포인터에 포함 된 파일 이름을 빠르게 읽는 것이기 때문에 가정합니다.

png로 이름이 바뀐 jpg의 사본을 만들었습니다.

크롬의 두 이미지에서 지속적으로 다음을 얻을 수있었습니다 (최신 브라우저에서 작동해야 함).

ÿØÿàJFIFÿþ;CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), quality = 90

이미지 유형에 대한 String.indexOf ( 'jpeg') 검사를 해킹 할 수 있습니다.

다음은 http://jsfiddle.net/bamboo/jkZ2v/1/ 을 탐색하는 바이올린입니다.

예제에서 언급하지 않은 모호한 줄

console.log( /^(.*)$/m.exec(window.atob( image.src.split(',')[1] )) );

  • base64로 인코딩 된 img 데이터를 분할하여 이미지를 남깁니다.
  • Base64는 이미지를 디코딩합니다
  • 이미지 데이터의 첫 줄만 일치

바이올린 코드는 IE9에서 작동하지 않는 base64 디코드를 사용합니다 .IE에서 작동하는 VB 스크립트를 사용하는 좋은 예를 찾았습니다 http://blog.nihilogic.dk/2008/08/imageinfo-reading-image-metadata-with.html

이미지를로드하는 코드는 Joel Vardy에서 가져온 것입니다 .Joel Vardy는 업로드하기 전에 클라이언트 측 크기를 조정하여 멋진 이미지 캔버스를 작성하고 있습니다. 관심있는 것은 https://joelvardy.com/writing/javascript-image-upload


1
JPEG에서 "jpeg"하위 문자열을 검색하지 마십시오. 주석에서 찾은 우연의 일치 일뿐입니다. JPEG 파일은 파일을 포함 할 필요가 없습니다 ( JFIF대신 검색하려는 경우 APP0EXIF-JPEG에 JFIF를 포함하지 않아도됩니다).
Kornel

"짧은 대답은 아니요"를 참조하십시오.
Lex
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.